Oyun teorisi, en iyi hamlenizin başkalarının ne yaptığına bağlı olduğu kararları inceler. Getiri matrisi, her seçim kombinasyonu için sonucu gösterir; Nash dengesi ise hiçbir oyuncunun tek başına strateji değiştirerek daha iyi duruma geçemediği seçimler kümesidir.

Bu üç fikir — strateji, getiri ve denge — oyun teorisine girişteki problemlerin çoğunun temelini oluşturur. Bunları kavradığınızda, ders kitaplarındaki birçok örneği okumak çok daha kolay hale gelir.

Oyun teorisinin tanımı: hangi soruyu sorar?

Sıradan bir optimizasyon probleminde, sabit bir durumda en iyi seçeneği seçersiniz. Oyun teorisinde ise durum değişebilir; çünkü diğer oyuncular da ya aynı anda ya da size tepki olarak seçim yapmaktadır.

Bu yüzden soru, “En iyi hamlem nedir?” olmaktan çıkıp “Başkalarının ne yapabileceğini düşünürsek en iyi hamlem nedir?” haline gelir. Bu değişim, stratejik etkileşimin temel fikridir.

Stratejiler ve getiriler sade dille

Strateji, bir oyuncunun oyunda kullanabileceği seçim ya da davranış kuralıdır. Basit ve tek turluk bir oyunda strateji, iş birliği yapmak ya da ihanet etmek gibi tek bir eylem olabilir.

Getiri, belirli bir seçim kombinasyonundan oyuncunun elde ettiği sonuçtur. Bu; para, puan, fayda ya da daha büyük sayının o oyuncu için daha iyi sonucu gösterdiği herhangi bir sıralama olabilir.

İki oyunculu bir oyunda bu sonuçlar çoğu zaman bir getiri matrisi içinde düzenlenir. Her hücre, Oyuncu A'nın bir stratejisini Oyuncu B'nin bir stratejisiyle eşleştirir.

Getiri matrisi nasıl okunur?

Aşağıda Mahkûmlar Açmazı türünde standart bir getiri matrisi verilmiştir. Her hücredeki ilk sayı Oyuncu A'nın, ikinci sayı ise Oyuncu B'nin getirisidir.

B: CooperateB: DefectA: Cooperate(3,3)(0,5)A: Defect(5,0)(1,1)\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Her hücreyi tam bir sonuç olarak okuyun:

  • İkisi de iş birliği yaparsa, her biri 33 alır.
  • Biri ihanet ederken diğeri iş birliği yaparsa, ihanet eden 55, iş birliği yapan ise 00 alır.
  • İkisi de ihanet ederse, her biri 11 alır.

Bu sayılar oyun teorisinin değişmez bir kuralı değildir. Bunlar yalnızca bir getiri düzenidir. Önemli olan teşvik yapısıdır: Her iki oyuncu da ihanet etmeye yönelir, oysa ikisi de karşılıklı iş birliğini karşılıklı ihanete tercih eder.

Nash dengesi: istikrarlı sonuç

Nash dengesi, diğer oyuncular stratejilerini değiştirmezken hiçbir oyuncunun tek başına strateji değiştirerek kendi getirisini artıramadığı stratejiler kümesidir.

Bunu söylemenin başka bir yolu da şudur: Her oyuncunun seçimi, diğerlerinin seçimlerine karşı en iyi tepkidir.

Bu, sonucun herkes için en iyi olduğu anlamına gelmez. Yalnızca hiç kimsenin tek taraflı olarak bu sonuçtan uzaklaşmak için bir teşviki olmadığı anlamına gelir.

Çözümlü örnek: Nash dengesi bulma

Yukarıdaki matrisi kullanın.

Oyuncu B iş birliği yaparsa, Oyuncu A iş birliği için 33 ile ihanet için 55'i karşılaştırır. İhanet daha iyidir.

Oyuncu B ihanet ederse, Oyuncu A iş birliği için 00 ile ihanet için 11'i karşılaştırır. Yine ihanet daha iyidir.

Dolayısıyla Oyuncu A için her iki durumda da en iyi tepki ihanettir. Simetri gereği aynı durum Oyuncu B için de geçerlidir.

Bu da (Defect,Defect)(\text{Defect}, \text{Defect}) durumunun bir Nash dengesi olduğu anlamına gelir. Her iki oyuncu da oradayken, hiçbiri tek başına değiştirerek durumunu iyileştiremez.

Ama bu, ortak olarak en iyi sonuç değildir. (Cooperate,Cooperate)(\text{Cooperate}, \text{Cooperate}) durumunda toplam getiri 3+3=63+3=6 iken, (Defect,Defect)(\text{Defect}, \text{Defect}) durumunda toplam getiri yalnızca 1+1=21+1=2 olur.

Temel içgörü şudur: Nash dengesi, topluca en iyi sonuç olmasa bile istikrarlı olabilir.

Öğrencilerin sık yaptığı hatalar

Yaygın bir hata, Nash dengesinin herkes için mümkün olan en iyi sonuç olduğunu sanmaktır. Öyle değildir. Yalnızca hiçbir oyuncunun tek başına değiştirerek kazanç sağlamadığı anlamına gelir.

Bir başka hata da getiri matrisini yalnızca tek bir oyuncunun bakış açısından okumaktır. Her hücre, her oyuncunun bakış açısından ayrı ayrı kontrol edilmelidir.

Öğrenciler bazen modelin getiri yapısına bağlı olduğunu da unutur. Getiriler değişirse, en iyi tepkiler ve denge de değişebilir.

Oyun teorisi nerelerde kullanılır?

Oyun teorisi; ekonomi, açık artırmalar, fiyatlandırma, müzakere, oylama, ağ tasarımı ve evrimsel biyolojide kullanılır. Ayrıntılar alana göre değişse de aynı temel soru tekrar tekrar karşımıza çıkar: Başkaları da seçim yaparken bir aktör nasıl davranmalıdır?

Daha ileri düzeyde oyun teorisi, karma stratejileri, tekrarlı oyunları ve ikiden fazla oyunculu oyunları da inceler. Ancak ilk aşamada temel sezgiyi kurmak için saf stratejiler ve bir getiri matrisi yeterlidir.

Benzer bir problem deneyin

Matristaki tek bir getiriyi değiştirip en iyi tepkileri yeniden hesaplayarak kendi versiyonunuzu deneyin. Örneğin, karşılıklı iş birliğinin getirisi (4,4)(4,4) olursa ya da karşılıklı ihanetin getirisi (2,2)(2,2) olursa ne olacağını sorun. Bu, dengenin stratejilere verilen adlara değil, teşviklere bağlı olduğunu görmenin en hızlı yollarından biridir.

Bir adım daha ileri gitmek isterseniz, bu düzeni oyuncuların birbirlerinin seçimleriyle eşleşmekten fayda sağladığı bir koordinasyon oyunuyla karşılaştırın. İki durumu yan yana görmek, Nash dengesini tanımayı çok daha kolaylaştırır.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →