Che cos'è la teoria dei giochi in parole semplici?

La teoria dei giochi studia decisioni in cui il risultato di ciascuno dipende non solo da ciò che fa lui, ma anche da ciò che fanno gli altri.

Che cos'è una matrice dei payoff?

Una matrice dei payoff è una tabella che elenca il risultato per ogni combinazione di strategie. In un gioco a due giocatori, ogni cella mostra un payoff per ciascun giocatore.

Teoria dei giochi — equilibrio di Nash, strategie e matrice dei payoff

Q: Che cos'è un equilibrio di Nash?

Un equilibrio di Nash è un profilo di strategie in cui nessun giocatore può migliorare il proprio payoff cambiando strategia da solo, mentre gli altri mantengono fisse le loro scelte.

La teoria dei giochi studia decisioni in cui la tua mossa migliore dipende da ciò che fanno gli altri. Una matrice dei payoff mostra il risultato per ogni combinazione di scelte, e un equilibrio di Nash è un insieme di scelte in cui nessun giocatore può fare meglio cambiando da solo.

Queste tre idee, strategia, payoff ed equilibrio, sono il nucleo della maggior parte dei problemi introduttivi di teoria dei giochi. Una volta capite, molti esempi da manuale diventano molto più facili da leggere.

Definizione di teoria dei giochi: quale domanda pone?

In un normale problema di ottimizzazione, scegli l'opzione migliore in una situazione fissa. Nella teoria dei giochi, la situazione può cambiare perché anche gli altri giocatori stanno scegliendo, nello stesso momento oppure in risposta a te.

Quindi la domanda cambia da "Qual è la mia mossa migliore?" a "Qual è la mia mossa migliore dato ciò che potrebbero fare gli altri?" Questo cambiamento è l'idea centrale dell'interazione strategica.

Strategie e payoff in parole semplici

Una strategia è una scelta disponibile per un giocatore, oppure una regola di comportamento nel gioco. In un gioco semplice a una sola mossa, una strategia può essere semplicemente un'azione, come cooperare o defezionare.

Un payoff è il risultato che un giocatore ottiene da una particolare combinazione di scelte. Può rappresentare denaro, punti, utilità o qualsiasi classificazione in cui un numero più grande indica un risultato migliore per quel giocatore.

In un gioco a due giocatori, questi risultati sono spesso organizzati in una matrice dei payoff. Ogni cella abbina una strategia del Giocatore A con una strategia del Giocatore B.

Come leggere una matrice dei payoff

Ecco una matrice dei payoff standard nello stile del dilemma del prigioniero. Il primo numero in ogni cella è il payoff del Giocatore A, e il secondo è quello del Giocatore B.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Leggi ogni cella come un risultato completo:

Se entrambi cooperano, ciascuno ottiene $3$ .
Se uno defeziona mentre l'altro coopera, chi defeziona ottiene $5$ e chi coopera ottiene $0$ .
Se entrambi defezionano, ciascuno ottiene $1$ .

I numeri esatti non sono una legge della teoria dei giochi. Sono solo un possibile schema di payoff. Ciò che conta è la struttura degli incentivi: ogni giocatore è tentato di defezionare, anche se entrambi preferirebbero finire nella cooperazione reciproca piuttosto che nella defezione reciproca.

Equilibrio di Nash: il risultato stabile

Un equilibrio di Nash è un insieme di strategie in cui nessun giocatore può migliorare il proprio payoff cambiando da solo, mentre gli altri giocatori mantengono invariate le loro strategie.

Un altro modo per dirlo è che la scelta di ciascun giocatore è una migliore risposta alle scelte degli altri.

Questo non significa che il risultato sia il migliore per tutti. Significa solo che nessuno ha un incentivo unilaterale ad allontanarsene.

Esempio svolto: trovare l'equilibrio di Nash

Usa la matrice sopra.

Se il Giocatore B coopera, il Giocatore A confronta cooperare per $3$ con defezionare per $5$ . Defezionare è meglio.

Se il Giocatore B defeziona, il Giocatore A confronta cooperare per $0$ con defezionare per $1$ . Defezionare è ancora meglio.

Quindi per il Giocatore A, defezionare è la migliore risposta in entrambi i casi. Per simmetria, lo stesso vale per il Giocatore B.

Questo significa che $(\text{Defect}, \text{Defect})$ è un equilibrio di Nash. Una volta che entrambi i giocatori sono lì, nessuno dei due può migliorare cambiando da solo.

Ma non è il miglior risultato congiunto. Il payoff totale in $(\text{Cooperate}, \text{Cooperate})$ è $3+3=6$ , mentre il payoff totale in $(\text{Defect}, \text{Defect})$ è solo $1+1=2$ .

Questa è l'idea chiave: un equilibrio di Nash può essere stabile senza essere il migliore dal punto di vista collettivo.

Errori comuni degli studenti

Un errore comune è pensare che equilibrio di Nash significhi il miglior risultato possibile per tutti. Non è così. Significa solo che nessun giocatore trae vantaggio dal cambiare da solo.

Un altro errore è leggere la matrice dei payoff solo dal punto di vista di un giocatore. Ogni cella deve essere controllata dal punto di vista di ciascun giocatore.

A volte gli studenti dimenticano anche che il modello dipende dalla struttura dei payoff. Se i payoff cambiano, anche le migliori risposte e l'equilibrio possono cambiare.

Quando si usa la teoria dei giochi

La teoria dei giochi si usa in economia, aste, determinazione dei prezzi, negoziazione, voto, progettazione di reti e biologia evolutiva. I dettagli cambiano a seconda del campo, ma la stessa domanda centrale ritorna sempre: come dovrebbe agire un agente quando anche gli altri stanno scegliendo?

In contesti più avanzati, la teoria dei giochi studia anche strategie miste, giochi ripetuti e giochi con più di due giocatori. Per una prima introduzione, però, le strategie pure e una matrice dei payoff bastano per costruire l'intuizione principale.

Prova un problema simile

Prova una tua versione cambiando un payoff nella matrice e ricalcolando le migliori risposte. Per esempio, chiediti che cosa succede se la cooperazione reciproca dà $(4,4)$ oppure se la defezione reciproca dà $(2,2)$ . Questo è uno dei modi più rapidi per vedere che l'equilibrio dipende dagli incentivi, non dalle etichette assegnate alle strategie.

Se vuoi fare un passo in più, confronta questa situazione con un gioco di coordinamento, in cui i giocatori traggono vantaggio dal far coincidere le proprie scelte. Vedere i due casi affiancati rende l'equilibrio di Nash molto più facile da riconoscere.

Hai bisogno di aiuto con un problema?

Carica la tua domanda e ottieni una soluzione verificata, passo dopo passo, in pochi secondi.

Apri GPAI Solver →