LA MICROECONOMÍA

Bernard Guerrien

JUEGOS REPETIDOS


Los juegos empleados hasta ahora son “resueltos” de la siguiente manera: cada uno anuncia la estrategia que ha seleccionado, de tal manera que se impone una de las salidas, con la correspondiente distribución de ganancias; acá termina el asunto. Si ninguno de los jugadores rechaza su elección, después de constatar la de los otros, entonces existe un equilibrio de Nash.

El hecho de que “todo se arregla en una sola oportunidad” es evidente incómodo, sobre todo si la salida retenida es sub-óptima. De acá se desprende la idea de juegos repetidos, que permitiría evitar semejantes salidas, para el bien de todos. Cómo no pensar en un proceso de ajuste, con una corrección progresiva de los errores, hasta lograr una salida “óptima”? En efecto, y como es frecuente cuando se desea traducir a una forma matemática lo que parece tener un “buen sentido”, la modelación de tal proceso no es evidente, particularmente en el marco de la teoría de juegos. Efectivamente, para que la modelación pueda determinar cuales son las preferencias racionales, debe precisar la información que tiene cada uno sobre las salidas del juego y también sobre el comportamiento de los otros y las reglas del juego por ejemplo, orden y número de los golpes.

Ahora, puede no existir problemas de aprendizaje en el marco de una información completa empleado hasta el presente, en tanto los jugadores tienen una “visión de conjunto” del juego repetido y de todas sus etapas posibles y se encuentra, por tanto, en una situación parecida a la del juego simple en el cual éstos sólo tienen que determinar su estrategia “óptima”. De la misma manera existe un equilibrio de Nash si es cierto que las estrategias retenidas para un juego repetido, en ocasiones denominado superjuego, no hacen arrepentir a ningún jugador de la decisión tomada.

Sin embargo, incluso si en una situación con información completa, ningún juego repetido difiere fundamentalmente de juego normal, conviene subrayar que presenta ciertas características propias: de un lado, su número de estrategias aumenta exponencialmente con el número de veces que se repita el juego y permite vislumbrar una gran diversidad de situaciones; por otro lado tal salida conduce a la situación de introducir el concepto de amenaza, que de hecho resalta muy bien el carácter condicional de las estrategias “si él hace esto, yo respondo con aquello”, pero también condiciona la idea básica del equilibrio de Nash: toda desviación unilateral por parte de un jugador implica una sanción por parte de los otros, o de algunos de ellos, sin que se tenga que recurrir a una instancia externa.

a) Horizonte finito o infinito.

Por sorprendente que pudiera parecer, el hecho de que un juego se pueda repetir dos o tres veces, o dos o tres mil veces, no modifica fundamentalmente su naturaleza; pero no sería así si se repite indefinidamente. El ejemplo del dilema del prisionero permite comprender por qué. Consideremos el caso más simple, el del juego repetido por una sola vez. Una estrategia posible podría ser “me callo en un primer interrogatorio; si el otro me ha denunciado, entonces lo denuncio en el segundo interrogatorio”. Se ve claramente que cada jugador puede escoger entre 8 estrategias distintas, incluso si algunas no fueran adoptadas por ejemplo “me callo, si el otro me denuncia sigo callado. Tal juego repetido no presenta sino un equilibrio de Nash, donde sólo se presenta la denuncia mutua en cada ocasión. Efectivamente, si un jugador adopta tal estrategia, el otro sólo puede hacer lo mismo ya que si se calla enfrentaría la pena máxima, y ello sin consideración del número de veces que se repita el juego al menos si el número es finito; Veremos, además, mas adelante que es el único equilibrio de tal juego repetido.

Es claro que repetir el juego no cambia para nada el problema establecido sub-optimalidad del equilibrio de Nash. Al contrario, tal problema se acentúa porque la “sub-optimalidad” aparece de manera más flagrante ya que las “pérdidas de bienestar” se multiplican por el número de veces que se repita el juego. Se puede decir, evidentemente, que el asunto no tiene importancia dado el caso mas bien anecdótico del “dilema del prisionero”. No obstante, no se puede olvidar que se ha ideado una forma divertida de traducir a la forma de un modelo simple, situaciones frecuentes de la vida en sociedad, tanto en el ámbito de los hogares y de las empresas como a nivel de toda la colectividad.

Los teóricos de los juegos han buscado resolver este dilema, con el riesgo de modificar las hipótesis del modelo. Así, han imaginado el caso en el cual el juego se repite indefinidamente; de esta manera si alguien adopta la estrategia: me callo, salvo si el otro me denuncia en un momento cualquiera; si él me denuncia, lo denuncio indefinidamente a partir de ese momento, acá hay un equilibrio de Nash. En efecto, tales “estrategias de amenaza” son entonces creíbles ya que quien se desvíe en cualquier momento, haciendo la denuncia del otro, obtiene una ganancia suplementaria, la “prima”, pero pasajera, cuyos efectos son anulados por las pérdidas inmediatas. Notemos que el hecho del juego no tener fecha final es muy importante, ya que si no fuera así pudiera darse una denuncia mutua en el último golpe y después, a causa de ello en el penúltimo golpe y así sucesivamente, hasta el primer golpe. De acá se deduce la unicidad del equilibrio de Nash repetido un número finito de veces.

b) Juego repetido y reputación

Si el hecho de repetir indefinidamente juegos, como el dilema del prisionero, permite llegar a soluciones mas conformes “al buen sentido”, ello sólo es posible apelando a una hipótesis difícil de defender el horizonte infinito, a no ser de que los jugadores no sepan que no son inmortales.

Para evitar tal hipótesis, los teóricos han buscado resolver las paradojas o los dilemas que ellos mismos han contribuido a crear, modificando sus modelos de la manera más ligera posible. Para ello han introducido una “brizna de irracionalidad” o, mas bien, la creencia por parte de un jugador que el otro o los otros puede(n) ser irracional(es).

Por ejemplo, en el dilema del prisionero, esta creencia se traduce en una probabilidade, que puede ser muy pequeña, pero no cero, de que el “otro” se va a callar; la incertidumbre generada de esta manera hace posible la solución consistente de no denunciarse mutamente, al menos si el juego se repite un número suficiente de veces un número de veces mayor en tanto la probabilidad e sea pequeña. En efecto, los dos jugadores proceden a un cálculo de la esperanza de ganancia, donde interviene e . Aunque tal esperanza sea pequeña, las ventajas que resultan de la no-denuncia en cada momento del juego son mejores que las que pueden surgir de la “prima” obtenida por la denuncia, habida cuenta las represalias consiguientes.

Este resultado se explica mejor adoptando directamente un punto de vista secuencial, que permite construir la categoría de reputación. En efecto, si en la primera aparición de un jugador, decide, de manera aparentemente “irracional”, no denunciar su cómplice, entonces este puede decidir actuar de manera parecida, sugiriendo que también puede tener un comportamiento irracional, de manera tal que en el siguiente golpe se presente una situación de no-denuncia mutua y así sucesivamente. Actuando así cada uno se forja una reputación de tener el “cuero duro”, de no ser un flojo, reputación que se refuerza a medida que el juego se repite.

De esta manera, el hecho de introducir la incertidumbre, incluso de manera muy limitada, sobre la racionalidad del comportamiento de los otros, puede conducir a una salida mucho más favorable para todos, que en el caso donde no se presenta la incertidumbre. Se emplean nociones como la reputación, considerada irrelevante en el dominio de la racionalidad. Se puede concluir que es completamente racional hacer creerque se puede actuar de manera irracional, para incitar a los otros a proceder en un cierto sentido.

d) Sobre la importancia de las creencias.

Se puede ver, por el anterior ejemplo, que interesa no lo que son los jugadores los unos con relación a los otros sino sus creencias sobre el asunto. El asunto de las creencias (que ya ha sido examinado cuando tratamos el tema de las conjeturas) está en el centro de la teoría de juegos. Incluso el equilibrio de Nash está fundado en la creencia de cada uno que “los otros” van a escoger una estrategia de equilibrio, de manera tal que todos los jugadores han de actuar con esa racionalidad; por tal razón sus creencias se cumplen existen, recordemos, profecías autorealizadas.

Surge una pregunta de manera inmediata: cómo se originan las creencias, en particular, como se forja una reputación? Tal pregunta, no puede en verdad ser resuelta por la teoría de juegos. Es cierto que la teoría puede entrever modelos ampliados, de aprendizaje por ejemplo, formándose así ciertas creencias; ahora bien, tales modelos se apoyan forzosamente en una u otra forma de creencia o, al menos, en alguna regla de conducta postulada a priori, esto es, no explicada o desprendida del principio de racionalidad.

En efecto, el papel esencial de las creencias aparece de manera incuestionable cuando uno se interesa en los juegos con información incompleta; el ejemplo que hemos tratado corresponde a esta categoría y allí los participantes no están completamente informados sobre sus racionalidades respectivas.