Teori Permainan — Keseimbangan Nash, Strategi & Matriks Payoff

Teori permainan mempelajari keputusan ketika langkah terbaik Anda bergantung pada apa yang dilakukan orang lain. Matriks payoff menunjukkan hasil untuk setiap kombinasi pilihan, dan keseimbangan Nash adalah sekumpulan pilihan di mana tidak ada pemain yang bisa memperoleh hasil lebih baik dengan berubah sendirian.

Tiga gagasan itu, yaitu strategi, payoff, dan keseimbangan, adalah inti dari sebagian besar soal pengantar teori permainan. Setelah Anda memahaminya, banyak contoh di buku teks akan jauh lebih mudah dibaca.

Definisi teori permainan: pertanyaan apa yang dijawab?

Dalam masalah optimasi biasa, Anda memilih opsi terbaik dalam situasi yang tetap. Dalam teori permainan, situasinya bisa berubah karena pemain lain juga sedang memilih, baik pada saat yang sama maupun sebagai respons terhadap Anda.

Jadi pertanyaannya berubah dari "Apa langkah terbaik saya?" menjadi "Apa langkah terbaik saya mengingat apa yang mungkin dilakukan orang lain?" Pergeseran inilah gagasan utama di balik interaksi strategis.

Strategi dan payoff dalam bahasa sederhana

Strategi adalah pilihan yang tersedia bagi seorang pemain atau aturan bertindak dalam permainan. Dalam permainan sederhana satu kali, strategi bisa berupa satu tindakan saja, seperti bekerja sama atau membelot.

Payoff adalah hasil yang diperoleh seorang pemain dari kombinasi pilihan tertentu. Ini bisa mewakili uang, poin, utilitas, atau peringkat apa pun di mana angka yang lebih besar berarti hasil yang lebih baik bagi pemain tersebut.

Dalam permainan dua pemain, hasil-hasil itu sering disusun dalam matriks payoff. Setiap sel memasangkan satu strategi dari Pemain A dengan satu strategi dari Pemain B.

Cara membaca matriks payoff

Berikut adalah matriks payoff bergaya Dilema Tahanan yang standar. Angka pertama di setiap sel adalah payoff Pemain A, dan angka kedua adalah payoff Pemain B.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Bacalah setiap sel sebagai satu hasil yang lengkap:

Jika keduanya bekerja sama, masing-masing mendapat $3$ .
Jika satu membelot sementara yang lain bekerja sama, si pembelot mendapat $5$ dan yang bekerja sama mendapat $0$ .
Jika keduanya membelot, masing-masing mendapat $1$ .

Angka-angka tepatnya bukan hukum dalam teori permainan. Itu hanya satu pola payoff. Yang penting adalah struktur insentifnya: setiap pemain tergoda untuk membelot, meskipun keduanya sebenarnya lebih memilih hasil kerja sama bersama daripada pembelotan bersama.

Keseimbangan Nash: hasil yang stabil

Keseimbangan Nash adalah sekumpulan strategi di mana tidak ada pemain yang dapat meningkatkan payoff-nya sendiri dengan berpindah sendirian, sementara pemain lain mempertahankan strateginya.

Cara lain untuk mengatakannya adalah bahwa pilihan setiap pemain merupakan respons terbaik terhadap pilihan pemain lain.

Ini tidak berarti hasilnya adalah yang terbaik untuk semua orang. Ini hanya berarti tidak ada yang punya insentif sepihak untuk meninggalkannya.

Contoh terurai: mencari keseimbangan Nash

Gunakan matriks di atas.

Jika Pemain B bekerja sama, Pemain A membandingkan bekerja sama dengan hasil $3$ dan membelot dengan hasil $5$ . Membelot lebih baik.

Jika Pemain B membelot, Pemain A membandingkan bekerja sama dengan hasil $0$ dan membelot dengan hasil $1$ . Membelot tetap lebih baik.

Jadi bagi Pemain A, membelot adalah respons terbaik dalam kedua kasus. Karena simetri, hal yang sama juga berlaku untuk Pemain B.

Artinya $(\text{Defect}, \text{Defect})$ adalah keseimbangan Nash. Setelah kedua pemain berada di sana, tidak ada satu pun yang bisa menjadi lebih baik dengan berubah sendirian.

Namun itu bukan hasil bersama yang terbaik. Total payoff pada $(\text{Cooperate}, \text{Cooperate})$ adalah $3+3=6$ , sedangkan total payoff pada $(\text{Defect}, \text{Defect})$ hanya $1+1=2$ .

Inilah wawasan utamanya: keseimbangan Nash bisa stabil tanpa menjadi yang terbaik secara kolektif.

Kesalahan umum yang dilakukan siswa

Salah satu kesalahan umum adalah mengira keseimbangan Nash berarti hasil terbaik yang mungkin untuk semua orang. Bukan begitu. Itu hanya berarti tidak ada pemain yang diuntungkan jika berubah sendirian.

Kesalahan lain adalah membaca matriks payoff hanya dari sudut pandang satu pemain. Setiap sel harus diperiksa dari sudut pandang masing-masing pemain.

Siswa juga kadang lupa bahwa model ini bergantung pada struktur payoff. Jika payoff berubah, respons terbaik dan keseimbangannya juga bisa berubah.

Kapan teori permainan digunakan

Teori permainan digunakan dalam ekonomi, lelang, penetapan harga, negosiasi, pemungutan suara, desain jaringan, dan biologi evolusioner. Rinciannya berbeda-beda menurut bidang, tetapi pertanyaan inti yang sama terus muncul: bagaimana seharusnya satu agen bertindak ketika agen lain juga sedang memilih?

Dalam situasi yang lebih lanjut, teori permainan juga mempelajari strategi campuran, permainan berulang, dan permainan dengan lebih dari dua pemain. Namun untuk tahap awal, strategi murni dan matriks payoff sudah cukup untuk membangun intuisi utamanya.

Coba soal serupa

Cobalah versi Anda sendiri dengan mengubah satu payoff dalam matriks lalu hitung ulang respons terbaiknya. Misalnya, tanyakan apa yang terjadi jika kerja sama bersama bernilai $(4,4)$ atau jika pembelotan bersama bernilai $(2,2)$ . Ini adalah salah satu cara tercepat untuk melihat bahwa keseimbangan bergantung pada insentif, bukan pada label yang ditempelkan pada strategi.

Jika Anda ingin melangkah sedikit lebih jauh, bandingkan susunan ini dengan permainan koordinasi, di mana para pemain diuntungkan jika mencocokkan pilihan satu sama lain. Melihat kedua kasus berdampingan membuat keseimbangan Nash jauh lebih mudah dikenali.

Pertanyaan yang sering diajukan

Apa itu teori permainan secara sederhana?: Teori permainan mempelajari keputusan ketika hasil yang diperoleh seseorang bergantung bukan hanya pada tindakannya sendiri, tetapi juga pada tindakan orang lain.
Apa itu matriks payoff?: Matriks payoff adalah tabel yang mencantumkan hasil untuk setiap kombinasi strategi. Dalam permainan dua pemain, setiap sel menunjukkan satu payoff untuk masing-masing pemain.
Apa itu keseimbangan Nash?: Keseimbangan Nash adalah profil strategi di mana tidak ada pemain yang dapat meningkatkan payoff-nya sendiri dengan mengubah strategi sendirian sementara pemain lain tetap pada pilihannya.

Butuh bantuan mengerjakan soal?

Unggah pertanyaanmu dan dapatkan solusi terverifikasi langkah demi langkah dalam hitungan detik.

Buka GPAI Solver →