Dilema del prisionero

Modelo canónico de teoría de juegos no cooperativa que muestra cómo dos agentes racionales pueden terminar en un resultado peor del que obtendrían si cooperaran. Formulado en 1950 por Merrill Flood y Melvin Dresher en la RAND Corporation, recibió su nombre por la ilustración narrativa que Albert Tucker propuso poco después: dos sospechosos detenidos por separado, cada uno con la opción de cooperar (callar) o desertar (delatar al otro). La estructura matemática del dilema reaparece en política, economía, biología evolutiva y, más recientemente, en seguridad de IA.

La matriz

La narrativa estándar: dos cómplices son interrogados en celdas separadas. Si ambos callan, cada uno cumple un año. Si uno delata y el otro calla, el delator queda libre y el silencioso cumple diez años. Si ambos delatan, cada uno cumple cinco años. La matriz de pagos en años de prisión:

	B calla	B delata
A calla	A:1, B:1	A:10, B:0
A delata	A:0, B:10	A:5, B:5

Para cada jugador, delatar es estrategia dominante: elija lo que elija el otro, delatar mejora el resultado individual. Por razonamiento simétrico, ambos delatan y obtienen (5, 5), peor que el resultado cooperativo (1, 1). La cooperación es colectivamente óptima e individualmente irracional.

Acepciones a no confundir

El dilema del prisionero no es un juego de suma cero: no se trata de que uno gane y el otro pierda, sino de que la lógica individual lleva a ambos a un resultado conjuntamente subóptimo. Tampoco es un juego con información incompleta: ambos conocen perfectamente la matriz; el problema es la imposibilidad de comprometerse de forma creíble.

Iteración: el cambio de paisaje

Cuando el juego se repite muchas veces entre los mismos jugadores, el cálculo cambia. Robert Axelrod organizó en 1980 un torneo computacional donde estrategias rivales se enfrentaban en partidas iteradas. Ganó Tit for Tat (Anatol Rapoport): empezar cooperando y, en cada turno siguiente, repetir lo que hizo el rival en el anterior. La conclusión central de The Evolution of Cooperation (1984) es que la cooperación puede emerger entre agentes racionales sin altruismo si cumplen tres condiciones (ser amables, reactivos y perdonadores) y la sombra del futuro es larga (los encuentros se repetirán y los jugadores lo saben).

Por qué importa

El dilema del prisionero es la unidad mínima del problema de la coordinación: el lugar más simple donde la racionalidad individual y el resultado colectivo divergen. Buena parte de los problemas estructurales contemporáneos comparten su forma: cambio climático (cada país gana posponiendo su transición; todos pierden si todos posponen), carrera armamentística, agotamiento de recursos comunes, dopaje deportivo. La dinámica generalizada a más de dos jugadores y a sistemas competitivos sin coordinación es la carrera al fondo que Scott Alexander bautizó como Moloch en 2014, y que en el caso particular de las plataformas digitales toma la forma de mierdificación.

En seguridad de IA reaparece en clave nueva: laboratorios y países pueden ver el desarrollo de superinteligencia como un dilema iterado donde detenerse unilateralmente para verificar seguridad equivale a perder la carrera frente a quien no se detiene. La “trampa” del dilema explica por qué pedir cooperación voluntaria sin estructura institucional rara vez funciona.

Dónde aparece en Nuevas Ciencias

Dioses, mascotas y centauros (postdata): el glosario de teoría de juegos lista el dilema del prisionero con esta glosa: “dos personas racionales eligen traicionarse aunque cooperar sería mejor para ambos. En IA: países y empresas aceleran el desarrollo de superinteligencia sin pausas de seguridad porque detenerse de forma unilateral significa perder la carrera”.

Conceptos vecinos

Fuentes

Stanford Encyclopedia of Philosophy: Prisoner’s Dilemma (Categoría 1)
Wikipedia EN: Prisoner’s dilemma (Categoría 1)
Axelrod, R. (1984). The Evolution of Cooperation. Basic Books. (Categoría 2)
Poundstone, W. (1992). Prisoner’s Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb. Doubleday. (Categoría 2)