¿Qué es la teoría de juegos en términos simples?

La teoría de juegos estudia decisiones en las que el resultado de cada persona depende no solo de lo que hace, sino también de lo que hacen los demás.

¿Qué es una matriz de pagos?

Una matriz de pagos es una tabla que muestra el resultado para cada combinación de estrategias. En un juego de dos jugadores, cada celda muestra un pago para cada jugador.

¿Qué es un equilibrio de Nash?

Un equilibrio de Nash es un perfil de estrategias en el que ningún jugador puede mejorar su propio pago cambiando de estrategia por sí solo mientras los demás mantienen sus elecciones fijas.

Teoría de juegos — equilibrio de Nash, estrategias y matriz de pagos

La teoría de juegos estudia decisiones en las que tu mejor movimiento depende de lo que hagan otras personas. Una matriz de pagos muestra el resultado de cada combinación de elecciones, y un equilibrio de Nash es un conjunto de elecciones en el que ningún jugador puede mejorar si cambia por sí solo.

Esas tres ideas —estrategia, pago y equilibrio— son el núcleo de la mayoría de los problemas introductorios de teoría de juegos. Cuando se entienden bien, muchos ejemplos de los libros de texto se vuelven mucho más fáciles de leer.

Definición de teoría de juegos: ¿qué pregunta plantea?

En un problema de optimización común, eliges la mejor opción en una situación fija. En teoría de juegos, la situación puede cambiar porque otros jugadores también están eligiendo, ya sea al mismo tiempo o en respuesta a ti.

Así, la pregunta cambia de "¿Cuál es mi mejor movimiento?" a "¿Cuál es mi mejor movimiento dado lo que podrían hacer los demás?". Ese cambio es la idea principal detrás de la interacción estratégica.

Estrategias y pagos en lenguaje sencillo

Una estrategia es la elección disponible de un jugador o su regla de actuación dentro del juego. En un juego simple de una sola ronda, una estrategia puede ser solo una acción, como cooperar o traicionar.

Un pago es el resultado que obtiene un jugador a partir de una combinación concreta de elecciones. Puede representar dinero, puntos, utilidad o cualquier clasificación en la que un número mayor signifique un mejor resultado para ese jugador.

En un juego de dos jugadores, esos resultados suelen organizarse en una matriz de pagos. Cada celda empareja una estrategia del Jugador A con una estrategia del Jugador B.

Cómo leer una matriz de pagos

Aquí tienes una matriz de pagos típica del dilema del prisionero. El primer número de cada celda es el pago del Jugador A, y el segundo es el del Jugador B.

\begin{array}{c|cc} & \text{B: Cooperate} & \text{B: Defect} \\ \hline \text{A: Cooperate} & (3,3) & (0,5) \\ \text{A: Defect} & (5,0) & (1,1) \end{array}

Lee cada celda como un resultado completo:

Si ambos cooperan, cada uno obtiene $3$ .
Si uno traiciona mientras el otro coopera, el que traiciona obtiene $5$ y el que coopera obtiene $0$ .
Si ambos traicionan, cada uno obtiene $1$ .

Los números exactos no son una ley de la teoría de juegos. Son solo un patrón posible de pagos. Lo importante es la estructura de incentivos: cada jugador se siente tentado a traicionar, aunque ambos preferirían terminar en cooperación mutua antes que en traición mutua.

Equilibrio de Nash: el resultado estable

Un equilibrio de Nash es un conjunto de estrategias en el que ningún jugador puede mejorar su propio pago cambiando por sí solo, mientras los demás jugadores mantienen sus estrategias sin cambios.

Otra forma de decirlo es que la elección de cada jugador es una mejor respuesta a las elecciones de los demás.

Eso no significa que el resultado sea el mejor para todos. Solo significa que nadie tiene un incentivo unilateral para alejarse de él.

Ejemplo resuelto: encontrar el equilibrio de Nash

Usa la matriz anterior.

Si el Jugador B coopera, el Jugador A compara cooperar para obtener $3$ con traicionar para obtener $5$ . Traicionar es mejor.

Si el Jugador B traiciona, el Jugador A compara cooperar para obtener $0$ con traicionar para obtener $1$ . Traicionar sigue siendo mejor.

Así que, para el Jugador A, traicionar es la mejor respuesta en ambos casos. Por simetría, lo mismo ocurre con el Jugador B.

Eso significa que $(\text{Defect}, \text{Defect})$ es un equilibrio de Nash. Una vez que ambos jugadores están ahí, ninguno puede mejorar cambiando por sí solo.

Pero no es el mejor resultado conjunto. El pago total en $(\text{Cooperate}, \text{Cooperate})$ es $3+3=6$ , mientras que el pago total en $(\text{Defect}, \text{Defect})$ es solo $1+1=2$ .

Esta es la idea clave: un equilibrio de Nash puede ser estable sin ser colectivamente el mejor.

Errores comunes que cometen los estudiantes

Un error común es pensar que equilibrio de Nash significa el mejor resultado posible para todos. No es así. Solo significa que ningún jugador se beneficia al cambiar por sí solo.

Otro error es leer la matriz de pagos solo desde la perspectiva de un jugador. Cada celda debe revisarse desde el punto de vista de cada jugador.

A veces, los estudiantes también olvidan que el modelo depende de la estructura de pagos. Si los pagos cambian, las mejores respuestas y el equilibrio también pueden cambiar.

Cuándo se usa la teoría de juegos

La teoría de juegos se usa en economía, subastas, fijación de precios, negociación, votación, diseño de redes y biología evolutiva. Los detalles cambian según el campo, pero la misma pregunta central vuelve una y otra vez: ¿cómo debe actuar un agente cuando los demás también están eligiendo?

En contextos más avanzados, la teoría de juegos también estudia estrategias mixtas, juegos repetidos y juegos con más de dos jugadores. Pero para una primera aproximación, las estrategias puras y una matriz de pagos bastan para construir la intuición principal.

Prueba un problema similar

Prueba tu propia versión cambiando un pago de la matriz y volviendo a calcular las mejores respuestas. Por ejemplo, pregúntate qué ocurre si la cooperación mutua paga $(4,4)$ o si la traición mutua paga $(2,2)$ . Esa es una de las formas más rápidas de ver que el equilibrio depende de los incentivos, no de las etiquetas asociadas a las estrategias.

Si quieres ir un paso más allá, compara esta situación con un juego de coordinación, en el que los jugadores se benefician al hacer coincidir sus elecciones. Ver ambos casos lado a lado hace que el equilibrio de Nash sea mucho más fácil de reconocer.

¿Necesitas ayuda con un problema?

Sube tu pregunta y obtén una solución verificada, paso a paso, en segundos.

Abrir GPAI Solver →