Oyun Teorisi — Nash Dengesi, Stratejiler ve Getiri Matrisi

Oyun teorisi, en iyi hamlenizin başkalarının ne yaptığına bağlı olduğu kararları inceler. Getiri matrisi, her seçim kombinasyonu için sonucu gösterir; Nash dengesi ise hiçbir oyuncunun tek başına strateji değiştirerek daha iyi duruma geçemediği seçimler kümesidir.

Bu üç fikir — strateji, getiri ve denge — oyun teorisine girişteki problemlerin çoğunun temelini oluşturur. Bunları kavradığınızda, ders kitaplarındaki birçok örneği okumak çok daha kolay hale gelir.

Oyun teorisinin tanımı: hangi soruyu sorar?

Sıradan bir optimizasyon probleminde, sabit bir durumda en iyi seçeneği seçersiniz. Oyun teorisinde ise durum değişebilir; çünkü diğer oyuncular da ya aynı anda ya da size tepki olarak seçim yapmaktadır.

Bu yüzden soru, “En iyi hamlem nedir?” olmaktan çıkıp “Başkalarının ne yapabileceğini düşünürsek en iyi hamlem nedir?” haline gelir. Bu değişim, stratejik etkileşimin temel fikridir.

Stratejiler ve getiriler sade dille

Strateji, bir oyuncunun oyunda kullanabileceği seçim ya da davranış kuralıdır. Basit ve tek turluk bir oyunda strateji, iş birliği yapmak ya da ihanet etmek gibi tek bir eylem olabilir.

Getiri, belirli bir seçim kombinasyonundan oyuncunun elde ettiği sonuçtur. Bu; para, puan, fayda ya da daha büyük sayının o oyuncu için daha iyi sonucu gösterdiği herhangi bir sıralama olabilir.

İki oyunculu bir oyunda bu sonuçlar çoğu zaman bir getiri matrisi içinde düzenlenir. Her hücre, Oyuncu A'nın bir stratejisini Oyuncu B'nin bir stratejisiyle eşleştirir.

Getiri matrisi nasıl okunur?

Aşağıda Mahkûmlar Açmazı türünde standart bir getiri matrisi verilmiştir. Her hücredeki ilk sayı Oyuncu A'nın, ikinci sayı ise Oyuncu B'nin getirisidir.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Her hücreyi tam bir sonuç olarak okuyun:

İkisi de iş birliği yaparsa, her biri $3$ alır.
Biri ihanet ederken diğeri iş birliği yaparsa, ihanet eden $5$ , iş birliği yapan ise $0$ alır.
İkisi de ihanet ederse, her biri $1$ alır.

Bu sayılar oyun teorisinin değişmez bir kuralı değildir. Bunlar yalnızca bir getiri düzenidir. Önemli olan teşvik yapısıdır: Her iki oyuncu da ihanet etmeye yönelir, oysa ikisi de karşılıklı iş birliğini karşılıklı ihanete tercih eder.

Nash dengesi: istikrarlı sonuç

Nash dengesi, diğer oyuncular stratejilerini değiştirmezken hiçbir oyuncunun tek başına strateji değiştirerek kendi getirisini artıramadığı stratejiler kümesidir.

Bunu söylemenin başka bir yolu da şudur: Her oyuncunun seçimi, diğerlerinin seçimlerine karşı en iyi tepkidir.

Bu, sonucun herkes için en iyi olduğu anlamına gelmez. Yalnızca hiç kimsenin tek taraflı olarak bu sonuçtan uzaklaşmak için bir teşviki olmadığı anlamına gelir.

Çözümlü örnek: Nash dengesi bulma

Yukarıdaki matrisi kullanın.

Oyuncu B iş birliği yaparsa, Oyuncu A iş birliği için $3$ ile ihanet için $5$ 'i karşılaştırır. İhanet daha iyidir.

Oyuncu B ihanet ederse, Oyuncu A iş birliği için $0$ ile ihanet için $1$ 'i karşılaştırır. Yine ihanet daha iyidir.

Dolayısıyla Oyuncu A için her iki durumda da en iyi tepki ihanettir. Simetri gereği aynı durum Oyuncu B için de geçerlidir.

Bu da $(\text{Defect}, \text{Defect})$ durumunun bir Nash dengesi olduğu anlamına gelir. Her iki oyuncu da oradayken, hiçbiri tek başına değiştirerek durumunu iyileştiremez.

Ama bu, ortak olarak en iyi sonuç değildir. $(\text{Cooperate}, \text{Cooperate})$ durumunda toplam getiri $3+3=6$ iken, $(\text{Defect}, \text{Defect})$ durumunda toplam getiri yalnızca $1+1=2$ olur.

Temel içgörü şudur: Nash dengesi, topluca en iyi sonuç olmasa bile istikrarlı olabilir.

Öğrencilerin sık yaptığı hatalar

Yaygın bir hata, Nash dengesinin herkes için mümkün olan en iyi sonuç olduğunu sanmaktır. Öyle değildir. Yalnızca hiçbir oyuncunun tek başına değiştirerek kazanç sağlamadığı anlamına gelir.

Bir başka hata da getiri matrisini yalnızca tek bir oyuncunun bakış açısından okumaktır. Her hücre, her oyuncunun bakış açısından ayrı ayrı kontrol edilmelidir.

Öğrenciler bazen modelin getiri yapısına bağlı olduğunu da unutur. Getiriler değişirse, en iyi tepkiler ve denge de değişebilir.

Oyun teorisi nerelerde kullanılır?

Oyun teorisi; ekonomi, açık artırmalar, fiyatlandırma, müzakere, oylama, ağ tasarımı ve evrimsel biyolojide kullanılır. Ayrıntılar alana göre değişse de aynı temel soru tekrar tekrar karşımıza çıkar: Başkaları da seçim yaparken bir aktör nasıl davranmalıdır?

Daha ileri düzeyde oyun teorisi, karma stratejileri, tekrarlı oyunları ve ikiden fazla oyunculu oyunları da inceler. Ancak ilk aşamada temel sezgiyi kurmak için saf stratejiler ve bir getiri matrisi yeterlidir.

Benzer bir problem deneyin

Matristaki tek bir getiriyi değiştirip en iyi tepkileri yeniden hesaplayarak kendi versiyonunuzu deneyin. Örneğin, karşılıklı iş birliğinin getirisi $(4,4)$ olursa ya da karşılıklı ihanetin getirisi $(2,2)$ olursa ne olacağını sorun. Bu, dengenin stratejilere verilen adlara değil, teşviklere bağlı olduğunu görmenin en hızlı yollarından biridir.

Bir adım daha ileri gitmek isterseniz, bu düzeni oyuncuların birbirlerinin seçimleriyle eşleşmekten fayda sağladığı bir koordinasyon oyunuyla karşılaştırın. İki durumu yan yana görmek, Nash dengesini tanımayı çok daha kolaylaştırır.

Sıkça Sorulan Sorular

Oyun teorisi basitçe nedir?: Oyun teorisi, her kişinin sonucunun yalnızca kendi yaptıklarına değil, başkalarının ne yaptığına da bağlı olduğu kararları inceler.
Getiri matrisi nedir?: Getiri matrisi, her strateji kombinasyonu için sonucu gösteren bir tablodur. İki oyunculu bir oyunda, her hücre her oyuncu için birer getiri gösterir.
Nash dengesi nedir?: Nash dengesi, diğerleri seçimlerini sabit tutarken hiçbir oyuncunun stratejisini tek başına değiştirerek kendi getirisini artıramadığı strateji profilidir.

Bir soruyla yardıma mı ihtiyacın var?

Sorunuzu yükleyin ve saniyeler içinde doğrulanmış adım adım çözüm alın.

GPAI Solver Aç →