Qu’est-ce que la théorie des jeux en termes simples ?

La théorie des jeux étudie les décisions où le résultat de chacun dépend non seulement de ce qu’il fait, mais aussi de ce que font les autres.

Qu’est-ce qu’une matrice des gains ?

Une matrice des gains est un tableau qui indique le résultat pour chaque combinaison de stratégies. Dans un jeu à deux joueurs, chaque case montre un gain pour chaque joueur.

Théorie des jeux — équilibre de Nash, stratégies et matrice des gains

Q: Qu’est-ce qu’un équilibre de Nash ?

Un équilibre de Nash est un profil de stratégies où aucun joueur ne peut améliorer son propre gain en changeant seul de stratégie pendant que les autres gardent leurs choix fixes.

La théorie des jeux étudie les décisions où votre meilleur choix dépend de ce que font les autres. Une matrice des gains montre le résultat pour chaque combinaison de choix, et un équilibre de Nash est un ensemble de choix où aucun joueur ne peut faire mieux en changeant seul.

Ces trois idées — stratégie, gain et équilibre — sont au cœur de la plupart des problèmes d’introduction à la théorie des jeux. Une fois qu’elles deviennent claires, beaucoup d’exemples de manuels sont bien plus faciles à comprendre.

Définition de la théorie des jeux : quelle question pose-t-elle ?

Dans un problème d’optimisation ordinaire, vous choisissez la meilleure option dans une situation fixe. En théorie des jeux, la situation peut changer parce que d’autres joueurs font aussi des choix, soit en même temps, soit en réaction à vous.

La question passe donc de « Quel est mon meilleur choix ? » à « Quel est mon meilleur choix compte tenu de ce que les autres pourraient faire ? » Ce changement est l’idée centrale de l’interaction stratégique.

Stratégies et gains en langage simple

Une stratégie est le choix disponible d’un joueur, ou sa règle d’action dans le jeu. Dans un jeu simple joué une seule fois, une stratégie peut n’être qu’une seule action, comme coopérer ou trahir.

Un gain est le résultat qu’un joueur obtient pour une combinaison particulière de choix. Il peut représenter de l’argent, des points, une utilité, ou tout classement où un nombre plus grand signifie un meilleur résultat pour ce joueur.

Dans un jeu à deux joueurs, ces résultats sont souvent organisés dans une matrice des gains. Chaque case associe une stratégie du joueur A à une stratégie du joueur B.

Comment lire une matrice des gains

Voici une matrice des gains classique de type dilemme du prisonnier. Le premier nombre dans chaque case est le gain du joueur A, et le second est celui du joueur B.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Lisez chaque case comme un résultat complet :

Si les deux coopèrent, chacun obtient $3$ .
Si l’un trahit pendant que l’autre coopère, celui qui trahit obtient $5$ et celui qui coopère obtient $0$ .
Si les deux trahissent, chacun obtient $1$ .

Les nombres exacts ne sont pas une loi de la théorie des jeux. Ils ne représentent qu’une structure de gains possible. Ce qui compte, c’est la structure des incitations : chaque joueur est tenté de trahir, même si les deux préféreraient la coopération mutuelle à la trahison mutuelle.

Équilibre de Nash : l’issue stable

Un équilibre de Nash est un ensemble de stratégies où aucun joueur ne peut améliorer son propre gain en changeant seul, pendant que les autres joueurs gardent leurs stratégies inchangées.

On peut aussi dire que le choix de chaque joueur est une meilleure réponse aux choix des autres.

Cela ne veut pas dire que le résultat est le meilleur pour tout le monde. Cela signifie seulement que personne n’a intérêt, à lui seul, à s’en écarter.

Exemple détaillé : trouver un équilibre de Nash

Utilisons la matrice ci-dessus.

Si le joueur B coopère, le joueur A compare coopérer pour $3$ et trahir pour $5$ . Trahir est préférable.

Si le joueur B trahit, le joueur A compare coopérer pour $0$ et trahir pour $1$ . Trahir reste préférable.

Donc, pour le joueur A, trahir est la meilleure réponse dans les deux cas. Par symétrie, c’est la même chose pour le joueur B.

Cela signifie que $(\text{Defect}, \text{Defect})$ est un équilibre de Nash. Une fois que les deux joueurs s’y trouvent, aucun des deux ne peut améliorer son résultat en changeant seul.

Mais ce n’est pas le meilleur résultat commun. Le gain total en $(\text{Cooperate}, \text{Cooperate})$ est $3+3=6$ , tandis que le gain total en $(\text{Defect}, \text{Defect})$ n’est que de $1+1=2$ .

C’est l’idée essentielle : un équilibre de Nash peut être stable sans être collectivement optimal.

Erreurs fréquentes des étudiants

Une erreur fréquente consiste à penser qu’un équilibre de Nash est le meilleur résultat possible pour tout le monde. Ce n’est pas le cas. Cela signifie seulement qu’aucun joueur ne gagne à changer seul.

Une autre erreur est de lire la matrice des gains du point de vue d’un seul joueur. Chaque case doit être examinée du point de vue de chaque joueur.

Les étudiants oublient aussi parfois que le modèle dépend de la structure des gains. Si les gains changent, les meilleures réponses et l’équilibre peuvent changer eux aussi.

Quand la théorie des jeux est utilisée

La théorie des jeux est utilisée en économie, dans les enchères, la tarification, la négociation, le vote, la conception de réseaux et la biologie évolutive. Les détails varient selon le domaine, mais la même question centrale revient sans cesse : comment un agent doit-il agir lorsque les autres choisissent eux aussi ?

Dans des cadres plus avancés, la théorie des jeux étudie aussi les stratégies mixtes, les jeux répétés et les jeux à plus de deux joueurs. Pour une première approche, cependant, les stratégies pures et une matrice des gains suffisent pour construire l’intuition principale.

Essayez un problème similaire

Essayez votre propre version en modifiant un gain dans la matrice puis en recalculant les meilleures réponses. Par exemple, demandez-vous ce qui se passe si la coopération mutuelle rapporte $(4,4)$ ou si la trahison mutuelle rapporte $(2,2)$ . C’est l’un des moyens les plus rapides de voir que l’équilibre dépend des incitations, et non des étiquettes attachées aux stratégies.

Si vous voulez aller un peu plus loin, comparez cette situation à un jeu de coordination, où les joueurs ont intérêt à faire les mêmes choix. Voir les deux cas côte à côte rend l’équilibre de Nash beaucoup plus facile à reconnaître.

Besoin d'aide pour un problème ?

Envoyez votre question et obtenez une solution vérifiée, étape par étape, en quelques secondes.

Ouvrir GPAI Solver →