Teoria dos Jogos — Equilíbrio de Nash, Estratégias e Matriz de Payoff

A teoria dos jogos estuda decisões em que sua melhor jogada depende do que as outras pessoas fazem. Uma matriz de payoff mostra o resultado de cada combinação de escolhas, e um equilíbrio de Nash é um conjunto de escolhas em que nenhum jogador consegue melhorar ao mudar sozinho.

Essas três ideias — estratégia, payoff e equilíbrio — formam a base da maioria dos problemas introdutórios de teoria dos jogos. Quando elas fazem sentido, muitos exemplos de livros ficam bem mais fáceis de entender.

Definição de teoria dos jogos: que pergunta ela faz?

Em um problema comum de otimização, você escolhe a melhor opção em uma situação fixa. Na teoria dos jogos, a situação pode mudar porque outros jogadores também estão escolhendo, ao mesmo tempo ou em resposta a você.

Então a pergunta muda de “Qual é a minha melhor jogada?” para “Qual é a minha melhor jogada dado o que os outros podem fazer?”. Essa mudança é a ideia central por trás da interação estratégica.

Estratégias e payoffs em linguagem simples

Uma estratégia é a escolha disponível de um jogador ou sua regra de ação no jogo. Em um jogo simples de uma única rodada, uma estratégia pode ser apenas uma ação, como cooperar ou trair.

Um payoff é o resultado que um jogador recebe de uma combinação específica de escolhas. Ele pode representar dinheiro, pontos, utilidade ou qualquer classificação em que um número maior signifique um resultado melhor para aquele jogador.

Em um jogo de dois jogadores, esses resultados costumam ser organizados em uma matriz de payoff. Cada célula combina uma estratégia do Jogador A com uma estratégia do Jogador B.

Como ler uma matriz de payoff

Aqui está uma matriz de payoff no estilo clássico do Dilema do Prisioneiro. O primeiro número em cada célula é o payoff do Jogador A, e o segundo é o do Jogador B.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Leia cada célula como um resultado completo:

Se ambos cooperam, cada um recebe $3$ .
Se um trai enquanto o outro coopera, quem trai recebe $5$ e quem coopera recebe $0$ .
Se ambos traem, cada um recebe $1$ .

Os números exatos não são uma lei da teoria dos jogos. Eles são apenas um padrão possível de payoff. O que importa é a estrutura de incentivos: cada jogador é tentado a trair, mesmo que ambos prefiram terminar em cooperação mútua do que em traição mútua.

Equilíbrio de Nash: o resultado estável

Um equilíbrio de Nash é um conjunto de estratégias em que nenhum jogador pode melhorar seu próprio payoff mudando sozinho, enquanto os outros jogadores mantêm suas estratégias inalteradas.

Outra forma de dizer isso é que a escolha de cada jogador é uma melhor resposta às escolhas dos outros.

Isso não significa que o resultado seja o melhor para todos. Significa apenas que ninguém tem um incentivo unilateral para se afastar dele.

Exemplo resolvido: encontrando o equilíbrio de Nash

Use a matriz acima.

Se o Jogador B coopera, o Jogador A compara cooperar para ganhar $3$ com trair para ganhar $5$ . Trair é melhor.

Se o Jogador B trai, o Jogador A compara cooperar para ganhar $0$ com trair para ganhar $1$ . Trair continua sendo melhor.

Então, para o Jogador A, trair é a melhor resposta em qualquer caso. Por simetria, o mesmo vale para o Jogador B.

Isso significa que $(\text{Defect}, \text{Defect})$ é um equilíbrio de Nash. Quando os dois jogadores estão aí, nenhum deles consegue melhorar mudando sozinho.

Mas esse não é o melhor resultado conjunto. O payoff total em $(\text{Cooperate}, \text{Cooperate})$ é $3+3=6$ , enquanto o payoff total em $(\text{Defect}, \text{Defect})$ é apenas $1+1=2$ .

Essa é a ideia principal: um equilíbrio de Nash pode ser estável sem ser o melhor resultado coletivo.

Erros comuns que os estudantes cometem

Um erro comum é pensar que equilíbrio de Nash significa o melhor resultado possível para todos. Não significa. Quer dizer apenas que nenhum jogador se beneficia ao mudar sozinho.

Outro erro é ler a matriz de payoff apenas da perspectiva de um jogador. Cada célula precisa ser analisada do ponto de vista de cada jogador.

Os estudantes também às vezes esquecem que o modelo depende da estrutura de payoff. Se os payoffs mudam, as melhores respostas e o equilíbrio também podem mudar.

Quando a teoria dos jogos é usada

A teoria dos jogos é usada em economia, leilões, precificação, negociação, votação, projeto de redes e biologia evolutiva. Os detalhes mudam de área para área, mas a mesma pergunta central continua voltando: como um agente deve agir quando os outros também estão escolhendo?

Em contextos mais avançados, a teoria dos jogos também estuda estratégias mistas, jogos repetidos e jogos com mais de dois jogadores. Para uma primeira abordagem, porém, estratégias puras e uma matriz de payoff já bastam para construir a intuição principal.

Tente um problema parecido

Tente criar sua própria versão mudando um payoff na matriz e recalculando as melhores respostas. Por exemplo, pergunte o que acontece se a cooperação mútua rende $(4,4)$ ou se a traição mútua rende $(2,2)$ . Essa é uma das formas mais rápidas de perceber que o equilíbrio depende dos incentivos, e não dos rótulos dados às estratégias.

Se quiser ir um passo além, compare essa configuração com um jogo de coordenação, em que os jogadores se beneficiam ao combinar as escolhas um do outro. Ver os dois casos lado a lado torna o equilíbrio de Nash muito mais fácil de reconhecer.

Perguntas frequentes

O que é teoria dos jogos em termos simples?: A teoria dos jogos estuda decisões em que o resultado de cada pessoa depende não só do que ela faz, mas também do que os outros fazem.
O que é uma matriz de payoff?: Uma matriz de payoff é uma tabela que mostra o resultado para cada combinação de estratégias. Em um jogo de dois jogadores, cada célula mostra um payoff para cada jogador.
O que é um equilíbrio de Nash?: Um equilíbrio de Nash é um perfil de estratégias em que nenhum jogador pode melhorar seu próprio payoff mudando de estratégia sozinho, enquanto os outros mantêm suas escolhas fixas.

Precisa de ajuda com um problema?

Envie sua pergunta e receba uma solução verificada, passo a passo, em segundos.

Abrir GPAI Solver →