Economía y Empresa
Teoría de juegos
Teoría de Juegos
1.- Introducción.
La teoría de juegos examina el comportamiento estratégico de jugadores que interactúan motivados por la maximización de la utilidad y que saben que los otros participantes son racionales. Su campo de aplicación es enorme y va desde la economía a la biología. La teoría de juegos comienza con trabajos de Zermelo (1913), quién muestra que juegos como el ajedrez son resolubles. Borel (1921) y Von Neumann (1959) en los años 20 estudian los equilibrios de tipo minimax en juegos de suma cero, es decir, juegos en los que lo que gana un jugador lo pierde su rival. Sin embargo, el primer avance importante ocurre en los años 40, con la publicación del libro sobre Teoría de Juegos de Neumann y Morgenstern (1944) que divulgó una formalización general de juegos en su forma extendida y normal, introdujo el concepto de estrategia en juegos extensivos y propuso aplicaciones. En los años 50 hubo un desarrollo importante de estas ideas en Princeton, con Luce y Raiffa (1957), difundiendo los resultados en su libro introductorio, Kuhn (1953) trabajando en definir el concepto de información en juegos, Shapley (1953) que permitió establecer una forma de atacar los juegos cooperativos (es decir, aquellos en los que los jugadores pueden establecer contratos para actuar en forma mancomunada) y por fin Nash (1950) quién definió el equilibrio que lleva su nombre, lo que permitió extender la teoría a juegos no-cooperativos más generales que los de suma cero. Durante esa época, el Departamento de Defensa de los EE.UU. fue el que financió las investigaciones en el tema, debido a que la mayor parte de las aplicaciones de los juegos de tipo suma-cero se concentraban en temas de estrategia militar.
En los 60 y 70 Harsany (1967) extendió la teoría de juegos a juegos de información incompleta, es decir, aquellos en que los jugadores no conocen todas las características del juego: por ejemplo, no saben lo que obtienen los otros jugadores como recompensa. Ante la multiplicidad de equilibrios de Nash, muchos de los cuales no eran soluciones razonables a juegos, Selten (1975) definió el concepto de equilibrio perfecto en el subjuego para juegos de información completa y una generalización para el caso de juegos de información imperfecta.
Ejemplo 1.- Ejemplos de juegos:
1. El análisis de las negociaciones. Las negociaciones entre sindicato y empresa, por ejemplo, se pueden analizar como juegos en que las partes tratan de dividir el excedente de la empresa antes de pagar los salarios.
2. El análisis de las licitaciones. Las empresas y el Estado utilizan procesos de licitación para comprar o vender bienes y servicios. Es importante saber cuales son los mecanismos de licitación adecuados ante cada tipo de licitación y sus debilidades.
3. El comportamiento de las firmas ante la entrada de competencia. Las firmas pueden ser agresivas frente a la nueva competencia, reduciendo precios y aumentando el gasto publicitario o pueden acomodar la entrada, tratando de llegar a un entendimiento con la firma entrante.
4. Los juegos de atrición, en los que se evalúa la capacidad para resistir y que permiten evaluar la situación de defensa de un país.
5. Estrategias en comercio internacional. En el comercio internacional, los gobiernos protegen la producción nacional a costa de las empresas extranjeras, evaluando el costo que podría tener una posible reacción de los gobiernos extranjeros.
6. Análisis político. Las reglas electorales alteran las plataformas electorales de los candidatos y se pueden estudiar las consecuencias de distintos tipos de reglas.
7. Evolución de las especies biológicas. Las especies que conocemos son el producto de un largo proceso de interacciones con otras especies. Los genes y la influencia de estos sobre su comportamiento y características físicas hacen que individuos de una especie tengan distinta capacidad reproductora, con lo que los genes más exitosos en el juego reproductivo son los que sobreviven.
2.- Definiciones.
Definición 1.- Un juego en forma extensiva está compuesto de:
1. El conjunto de jugadores i 1…n, quienes toman decisiones y son racionales (maximizan su utilidad).
2. Un árbol del juego compuesto de:
(a) Nodos, cada uno asignado a un sólo jugador.
(b) Las acciones (ramas) que dispone un jugador en cada uno de sus nodos.
3. La información que dispone un jugador en cada nodo en el que le toca decidir. La información se describe mediante conjuntos de información, que son conjuntos de nodos que el jugador puede distinguir entre sí.
4. Las estrategias si Si de cada jugador, que son libros de instrucciones que le dicen al jugador qué acción elegir cuando llega a uno de sus conjuntos de información. Es decir, son funciones desde los conjuntos de información del jugador a las acciones que tiene en cada conjunto de información.
5. Los pagos ui a los jugadores en los nodos terminales del árbol del juego.
Ejemplo 2.- Consideremos el juego en la izquierda de la figura 1. En este juego, el primer jugador toma una moneda en una mano. El segundo jugador puede observar su acción. El segundo jugador debe determinar si el jugador 1 tomó la moneda en su mano izquierda o en su mano derecha. Si acierta (lo que es trivial pues observa la acción del primer jugador), su pago es 1 y el jugador 2 obtiene -1. Si no acierta, recibe un pago de -1 y el jugador 1 recibe 1.
El primer jugador tiene un solo nodo que es a su vez su único conjunto de información (un singleton). En este conjunto de información puede elegir entre sus acciones I o D, es decir, posee dos estrategias: S1 = (I, D) El segundo jugador posee dos nodos que puede distinguir entre sí, ya que sabe lo que ha jugado el jugador 1, es decir, posee dos conjuntos de información (también singletons). En cada uno puede elegir dos acciones, lo que da un total de 2x2=4 estrategias distintas. Las estrategias del jugador 2 son: S2 = ((i; i); (i; d); (d; i); (d; d))
El juego de la derecha en la figura 1 es similar, salvo porque el jugador 2 no puede observar lo que ha hecho el jugador 1, ya que éste elige a escondidas. En este caso, el jugador 2 no puede distinguir entre su nodo izquierdo y su nodo derecho, es decir, tiene un solo conjunto de información. Distinguimos los nodos que pertenecen a un mismo conjunto de información mediante una línea punteada que los une, como se muestra en la figura de la derecha.
Cuando decide su acción, el jugador 2 no sabe en cuál de los dos nodos de su conjunto de información se encuentra, por lo que no puede usar estrategias que condicionan lo que hace en el nodo en que se encuentra. Tiene que elegir la misma acción en ambos nodos. Dispone, pues, de sólo dos estrategias S2 = (i; d)
Es importante notar que una estrategia le dice a un jugador qué hacer en cada posible situación (conjunto de información) en que el jugador podría encontrarse y no sólo en aquella que resulta ser la trayectoria de equilibrio del juego. Esto resulta esencial ya que los equilibrios que resultan dependen de lo que se haga en conjuntos de información fuera del equilibrio, como lo es por ejemplo una amenaza que atemoriza a otro jugador y por lo tanto, que no se lleva a cabo, pero afecta el equilibrio del juego.
Definición 2.- La n combinación de estrategias que le asigna una estrategia a cada jugador es una combinación de estrategias s S" Si.
Cuando cada jugador elige una estrategia en el juego, la combinación de estrategias resultante define una trayectoria que lleva desde el comienzo del juego hasta uno de los nodos terminales, es decir determina los pagos que reciben los jugadores, ui: S !R.
Ejemplo 3.- En el ejemplo de la moneda, izquierda, hay 4x2=8 posibles combinaciones de estrategias. Un ejemplo es (I; (d; i)). ¿Cuál es el nodo terminal asociado?
Notación: Para cada jugador i, distinguimos por el subíndice -i la (n-1) combinación de estrategias de los demás jugadores, es decir s-i = (s1,…, si-1, si+1,…, sn) S-i.
Dada la notación anterior, la combinación de estrategias s se puede escribir como s = (si, s-i).
3.- Conceptos de solución en estrategias puras.
Una vez definido lo que es un juego, es necesario encontrar formas de resolverlo, mecanismos que encuentren la forma en que jugadores racionales elegirían jugar el juego. Comenzamos analizando el concepto de equilibrio en estrategias dominantes, no sólo porque fue uno de los primeros tipos de equilibrios examinados, sino porque tiene aplicaciones importantes.
Definición 3.- Una estrategia s del jugador i es mejor respuesta a s-i (las estrategias de los demás jugadores) si ui (s*, s-i) " ui (si, s-i), para todo si.
Ejemplo 4.- En el ejemplo de la moneda, figura izquierda, s2 = (i, i) es una mejor respuesta a s1 = I. ¿Existe otra estrategia de 2 que también sea mejor respuesta a esta estrategia del jugador 1?
Definición 4.- Una estrategia s del jugador i es dominante si es la mejor respuesta a todas las estrategias de los demás jugadores: ui (si*, s-i)" ui (si, s-i), para todo si y s-i, con desigualdad estricta para al menos algún si.
Consideremos las dos definiciones anteriores. Una estrategia que es mejor respuesta es lo mejor ante una determinada elección de los demás jugadores. Una estrategia dominante es mejor respuesta ante todas las estrategias de los demás. Cuando existe una estrategia dominante, los jugadores siempre la usan, porque es lo mejor que pueden hacer, independientemente de lo que hagan los demás jugadores.
Definición 5.- Una estrategia si es débilmente dominada por s´i si para todo s-i se tiene que: ui (s´i, s-i) " ui (si, s-i), con desigualdad estricta para el menos un s-i.
La definición anterior permite descartar estrategias que nunca serán utilizadas por un jugador racional ya que es peor que otra estrategia, no importando lo que hagan los demás jugadores. Tengamos en cuenta que, sin embargo, una estrategia que domina a otra no tiene por que ser dominante.
3.1.- Equilibrio en estrategias dominantes.
Las definiciones anteriores nos permiten plantear una primera definición de solución de un juego, ideada por von Neumann.
Definición 6.- Una combinación de estrategias s* = (si* ) i=1 es un equilibrio en estrategias dominantes si cada si* es dominante.
El concepto de equilibrio en estrategias dominantes es poderoso ya que cuando existe, tiene todas las propiedades posibles: es único y nadie tiene mejores alternativas desde un punto de vista individual. El problema de este concepto de equilibrio es que no todos los juegos tienen un equilibrio en estrategias dominantes. En general los jugadores no disponen de estrategias dominantes as que en el conjunto de juegos posibles, son pocos los que tienen este tipo de equilibrios. Sin embargo, existen juegos muy importantes como el Dilema del prisionero que tienen equilibrios en estrategias dominantes.
Ejemplo 5.- El dilema del prisionero. Dos individuos con antecedentes criminales son detenidos en un barrio elegante mientras caminan con una carretilla cargada con artículos electrónicos que la policía sospecha son robados. En la cárcel, detectives los interrogan por separado y les hacen ofertas. Si el prisionero confiesa, se le dejará libre, siempre y cuando su colega no haya confesado. Por el contrario, si no confiesa, pero su colega lo hace, tendrá una condena de 10 años de cárcel. Los prisioneros también saben que si ninguno confiesa, no los podrán mantener detenidos más de un año y que si ambos confiesan, pasarán 9 años en la cárcel. La figura 2 muestra el juego.
Consideremos al prisionero 1. Supongamos que cree que el prisionero 2 respeta sus promesas anteriores y no confiesa. Si el prisionero 1 confiesa, sale libre, lo que es preferible a la opción de no confesar, que acarrea un año de condena (dado que el otro prisionero no confiesa). Si por el contrario, cree que el prisionero 2 va a confesar, no importando sus promesas anteriores, confesar le da 9 años de cárcel, lo que es mejor que cargar con todas las culpas y 10 años de cárcel al no confesar. Por lo tanto, no importando lo que haga el prisionero 2, el prisionero 1 está mejor confesando: es su estrategia dominante. Lo mismo ocurre con el prisionero 2, por lo que el único equilibrio en estrategias dominantes es aquel en que ambos prisioneros confiesan. Es notable que a pesar que cooperando les hubiera ido mejor, ambos confiesan y terminan peor.
El dilema del prisionero es un juego de enorme importancia. Proporciona una explicación para las dificultades para establecer la cooperación entre agentes económicos. El dilema del prisionero también es relevante en la formación de carteles (acuerdos entre firmas) para subir los precios, ya que las firmas se ven tentadas a vender más de lo acordado a los altos precios que resultan de los carteles, lo que reduce los precios. El dilema del prisionero muestra las dificultades para establecer la colaboración en cualquier situación en la que hacer trampa beneficia a las partes.
Como se ha mencionado antes, el equilibrio en estrategias dominantes no siempre existe, porque no siempre los jugadores disponen de estrategias dominantes. Por lo tanto, es conveniente encontrar otro concepto de solución que sea aplicable a todo tipo de juegos, es decir, un tipo de equilibrio que exista en todo juego. El problema de un concepto de equilibrio de este tipo es que pueden haber múltiples equilibrios en un juego, lo que implica que es necesario poder seleccionar entre estos.
El análisis de muchos juegos no requiere la compleja estructura de la forma extensiva, con su énfasis en la dimensión temporal del juego. En estos casos se usa la forma normal del juego, que aparece por primera vez en Neumann y Morgenstern (1944).
Definición 7.- Un juego en forma normal está compuesto por:
1. Los jugadores, i 1… n.
2. Las estrategias si Si de cada jugador.
3. Los pagos ui (s) que reciben los jugadores.
La tabla 1 muestra el dilema del prisionero en su forma normal. Las estrategias de cada jugador aparecen como las leyendas de las columnas o filas y los pagos aparecen en las celdas, con la primera componente en cada celda correspondiendo al jugador 1. En ella se puede ver claramente que la combinación de estrategias (C, C) es un equilibrio en estrategias dominantes.
3.2.- Equilibrio por eliminación iterada de estrategias dominadas.
Supongamos que partiendo por el jugador 1, eliminamos todas sus estrategias estrictamente dominadas. En el nuevo juego que resulta, eliminamos todas las estrategias estrictamente dominadas del jugador 2 y as sucesivamente. Si, siguiendo este procedimiento, finalmente obtenemos una sola combinación de estrategias, se dice que es un equilibrio por eliminación iterada de estrategias dominadas.
En este juego, Kenney se da cuenta que la estrategia Sur de Imamura está estrictamente dominada por Norte. Eliminando esta estrategia, en el juego reducido que resulta Norte es dominante para Kenney. (Norte, Norte) es la solución por eliminación iterada de estrategias dominantes.
Lo interesante del concepto de eliminación iterada de estrategias dominadas es que requieren un supuesto de racionalidad de los jugadores. Cuando Kenney elimina la estrategia Sur de Imamura es porque sabe que a Imamura nunca le va a convenir utilizarla, y puede descartarla de su análisis. De la misma forma, en el Dilema del prisionero, la solución por eliminación iterada de estrategias estrictamente dominadas es el equilibrio en estrategias dominantes, (C, C). Aún cuando este concepto de equilibrio requiere mucha racionalidad de los actores, esto es razonable.
La situación es distinta cuando estudiamos el caso de estrategias débilmente dominadas. Consideremos el juego 6 modificado:
En tal caso, descartar la estrategia Sur de Imamura no es tan obvio. Si Kenney cree que Imamura podría usar Sur, descartar Sur como estrategia de Kenney ya no es obvio. Es por esto que la estrategia de eliminación iterada de estrategias débilmente dominadas tiene problemas:
-
En muchos casos, el procedimiento entrega más de una solución.
-
A menudo la solución alcanzada depende del orden de eliminación de estrategias (débilmente) dominadas.
Ejemplo 8 El resultado de EIED depende del orden de eliminación de estrategias.
En la tabla 2, denominemos por si " s´i cuando la primera estrategia está dominada por la segunda. Entonces, si eliminamos a T pues T " M y luego a L pues L " R en el juego reducido, el equilibrio contiene a R. Si en cambio eliminamos a B pues B " M, y luego a R pues R " L en el juego reducido, el equilibrio contiene a L.
Tabla 3: El juego del gallina.
Borel (1921) y Von Neumann (1959) demostraron en los años 20 que todo juego de suma cero tiene un equilibrio minimax en el que cada jugador actúa tratando de asegurarse el máximo beneficio ante lo peor que le puede hacer el otro jugador. Aunque útil para analizar temas de defensa, tiene un campo limitado de aplicaciones, pues en la mayoría de los juegos, la suma de los pagos en los nodos terminales no es constante, como lo vemos en el Dilema del prisionero. En su tesis de doctorado, John Nash (1950) definió el equilibrio que lleva su nombre, y demostró su existencia en todos los juegos no-cooperativos.
Definición 8.- Un equilibrio de Nash es una combinación de estrategias s*= (s1*,…,sn*) tal que para todo i, ui ( si*, s*-i) " ui (si, s*-i)
Es decir, en un equilibrio de Nash la estrategia de cada jugador es una mejor respuesta ante las estrategias de los otros jugadores. Es importante observar que no se dice nada acerca de qué buena es la estrategia del jugador frente a otras estrategias (no s*-i) de los demás jugadores. Es fácil observar que un equilibrio en estrategias dominantes es también un equilibrio de Nash.
En el juego que se muestra en la tabla 3 denominado el juego del gallina, no existe un equilibrio en estrategias dominantes, pero existen dos equilibrios de Nash.
En este juego, dos adolescentes van en direcciones opuestas en un camino abandonado. Chocarán a menos que uno de ellos se desvíe. El que se desvía es el gallina, y obtiene 0, mientras el otro se queda con el prestigio de ser valiente. El problema ocurre cuando ambos son valientes y ninguno se desvía. En este juego no hay estrategias dominantes y por ende, no hay equilibrio en estrategias dominantes. Existen dos equilibrios de Nash en estrategias (puras): en cada una de ellas, uno de los jugadores se desvía.
3.4.- Estrategias mixtas y existencia de equilibrios de Nash.
Consideremos nuevamente el juego de la moneda, derecha. Aquí se pueden probar todas las posibles combinaciones de estrategias (puras) y no existe un equilibrio de Nash en estas estrategias. Esto es razonable, pues cualquier estrategia (izquierda o derecha) que use uno de los agentes, el otro se podría aprovechar. Otra forma de verlo es que este juego es equivalente al del delantero y el portero en un penalti. Si el portero siempre se tira a la derecha, el delantero tiraría siempre a la izquierda. Si el delantero siempre tira a la derecha, el portero se tira en la misma dirección. La alternativa es que, en forma aleatoria, los dos jugadores usen la izquierda o la derecha. Este concepto es el que está detrás de la idea de estrategia mixta.
Definición 9.- Una estrategia mixta i= (i(si¹),…, i()) es una distribución de probabilidad sobre las mi estrategias del jugador i, que le asigna la probabilidad a que el jugador use su estrategia Una estrategia pura es un caso especial de estrategia mixta en el que el jugador le asigna probabilidad 1 a una de las estrategias del jugador.
De acuerdo a la definición anterior, las estrategias que se han visto hasta ahora son estrategias puras. Una estrategia mixta se puede interpretar como una ruleta (ver figura 3) que el jugador hace girar. En la ruleta se han establecido divisiones que particionan el círculo en áreas que corresponden a las probabilidades que la estrategia mixta le asigna a cada estrategia pura. El jugador hace girar la aguja y utiliza la estrategia elegida por la aguja. Cada jugador usa su propia ruleta y éstas son independientes entre si.
Notación: Una combinación de estrategias mixtas es
.
Una combinación de estrategias mixtas determina una distribución de probabilidad sobre los nodos terminales, es decir, sobre los pagos. El pago para i de una combinación de estrategias mixtas es el valor esperado calculado usando las probabilidades generadas por la estrategia mixta sobre los nodos terminales.
Definición 10.- El pago para i de la combinación de estrategias mixtas es:
Ejemplo 9.- En el caso específico del juego de la moneda, derecha, consideremos las estrategias 1 = (3/4; 1/4) y 2 = (1/4; 3/4). El valor esperado para el jugador 1 de esa combinación de estrategias mixtas es: (-10(3/16) + 10(9/16) + 10(1/16) - 10(3/16)) = 10/4 > 0.
Definición 11.- Una estrategia i del jugador i es dominada por
con desigualdad estricta para algún -i.
Definición 12.- Una estrategia i del jugador i es mejor respuesta a
Definición 13.- Un equilibrio de Nash es una combinación de estrategias *=(*1,…, *n) tal que
.
Se puede demostrar que los equilibrios de Nash siempre existen, lo que fue demostrado por John Nash en su tesis doctoral (Nash (1950)). Se puede demostrar que un equilibrio por eliminación iterada de estrategias estrictamente dominadas es un equilibrio de Nash (ver Fudenberg y Tirole)
El siguiente lema ayuda a caracterizar los equilibrios de Nash:
Lema 1.- Una condición necesaria y suficiente para que * sea un equilibrio de Nash es que para todo jugador i se tiene que si la probabilidad asignada por i* a una estrategia es positiva, entonces esta estrategia es mejor respuesta a *-i.
Demostración: Supongamos que * sea un equilibrio de Nash y que no sea mejor respuesta a *-i. Entonces se puede aumentar el pago esperado por el jugador i reduciendo la probabilidad asignada a y traspasándola a una estrategia pura que sea la mejor respuesta. Pero si eso se puede hacer, *i no es mejor respuesta a *-i, y por lo tanto, no sería un equilibrio de Nash.
Supongamos que cada una de las estrategias a las que *i le asigna peso positivo es mejor respuesta a *-i, pero que *i no forma parte de un equilibrio de Nash, es decir, *i no es mejor respuesta a *-i. Esto significa que existe que existe ´i que es mejor que *i para i, dado *-i. O sea alguna de las estrategias utilizadas con probabilidad positiva en ´i debe dar un pago mayor que alguna de las estrategias utilizadas con probabilidad positiva por *i. Pero esto significa que alguna de las estrategias utilizadas con probabilidad positiva por *i no es mejor respuesta a *-i.
Ejemplo 10.- Consideremos como encontrar los equilibrios de Nash del juego del gallina que se muestra en la tabla 3. Llamando S y D a las estrategias de Seguir y Desviarse, respectivamente, sabemos que existen dos equilibrios de Nash en estrategias puras: (S, D) y (D, S). Supongamos que = (1; 2) es un equilibrio de Nash. Los equilibrios en estrategias puras del juego de la gallina corresponden a: 1(D) = 1, 2(D) = 0 y 1(D) = 0, 2(D) = 1. Estudiemos ahora la existencia de equilibrios en estrategias mixtas: del lema 1 se tiene que para que 0 < 1(D) < 1 (y 0 < 1(S) = 1-2(D) < 1) sea un equilibrio de Nash, se debe tener que las estrategias D y S deben entregar el mismo pago (dado lo que hace el otro jugador). Es decir, se debe tener -100*2 (S) + 10*2 (D) = 0*2 (S) + 1*2 (D), lo que implica que *2 (S) = 9/109. Por simetría, *1 (S) = 9/109. Por lo tanto, *1 = (9/109, 100/109) = *2. Es interesante notar que en el equilibrio en estrategias mixtas, la probabilidad de chocar es algo menor de un 1%.
Es interesante señalar que situaciones estratégicas equivalentes al juego del gallina ocurren en la vida real. A mediados de los 90, dos empresas tenían planes para construir gasoductos desde Argentina hacia el valle central, con el objeto de proveer gas natural a plantas eléctricas de ciclo combinado y para uso industrial y domiciliario. El problema es que esto era un buen negocio para una compañía, pero resultaba un desastre económico si ambos proyectos se concretaban. Ambas empresas trataron de atemorizar a la otra mediante anuncios de gastos que indicarían que habían comprometido tal monto de recursos en el proyecto que era imposible abandonarlo. Este proceso duró meses, hasta que finalmente una de las empresas desistió del proyecto. La otra empresa construyó el gasoducto.
Pocos años después la situación se repitió en el norte de Chile. En el Norte la demanda de gas está asociada a proyectos mineros, los que requieren grandes cantidades de energía eléctrica. A mediados de los 90, la demanda crecía al 20% anual. El 85% de la demanda, aproximadamente 1400MW en 2001, correspondía a proyectos mineros. Para responder al aumento esperado de la demanda se proyectaron gasoductos desde Argentina. Tal como en el caso del gasoducto en la zona central, un proyecto era viable, pero no dos. Durante meses ambos proyectos jugaron el Juego del Gallina, pero finalmente ambos se llevaron a cabo. El resultado es una sobreabundancia de gas en el Norte y que los recursos sean, desde ya, irrecuperables desde un punto de vista económico. Cada proyecto requería la construcción de centrales para utilizar el gas. Peor aún, una tercera compañía decidió innovar y no hacer un gasoducto, sino generar la electricidad en Argentina (a partir de gas) y luego traer la electricidad al Norte mediante un cable de transmisión. El resultado es una enorme sobreoferta de electricidad en el Norte, que tiene una capacidad instalada de unas tres veces la demanda. Esto significa que las plantas de generación eléctrica también son irrecuperables económicamente. Las pérdidas de las compañías de seguir la estrategia (S; S) en este juego del gallina se estiman en mil a mil quinientos millones de dólares.
Como se ha mencionado, el equilibrio de Nash es más débil que el de equilibrio en estrategias dominantes. Al poco tiempo, los especialistas en teoría de juego se dieron cuenta que es fácil encontrar juegos con más de un equilibrio de Nash. En ese caso aparece la dificultad de saber si todos los equilibrios son igual de relevantes. En algunos casos, la multiplicidad es intrínseca: en el juego de la gallina no hay forma de decidir cuál entre (S; D) y (D; S) es preferible. En otros casos, en cambio, esta multiplicidad de equilibrios de Nash involucra algunos que son más “débiles”que otros equilibrios y por lo tanto deberían ser descartados en el análisis.
3.5.- Perfección en el subjuego.
Reinhart Selten (1975) observó que algunos de los equilibrios de Nash estaban basados en que los jugadores eligen estrategias porque temen que uno de los otros jugadores use una estrategia que les costaría caro si se desvían del equilibrio. Eso no es un problema si hubiera seguridad que la amenaza se va a llevar a cabo en caso que los otros no obedezcan. El problema es que existen otros equilibrios Nash en los cuales las amenazas no se llevarían a cabo, ya que no le convienen al jugador que las hace, por lo que no parece razonable que estos equilibrios sean robustos.
Ejemplo 11.- (Entrada de competencia) La figura 4 muestra una firma que es un monopolio (m) en una ciudad pequeña y que se enfrenta a la potencial entrada de un competidor. En este juego hay dos equilibrios de Nash, N1 = (E;A) y N2 = (NE;G). El problema es que el segundo equilibrio esta basado en una amenaza de castigo si es que la firma entrante efectivamente entra al mercado. La pregunta es: ¿debería el entrante creer en la amenaza del monopolista?
Una manera de enfocar el problema es considerar si la amenaza del monopolista es creíble, es decir, si es una amenaza que el monopolista llevaría a cabo en caso que le tocara jugar. Consideremos la situación del monopolista al llegar a su nodo (es decir, cuando el entrante ha decidido entrar). En ese momento el monopolio ya no puede cambiar la elección del entrante, entonces, ¿por qué sacrificarse para cumplir una amenaza? De esa forma es posible definir una amenaza no creíble si el jugador no utiliza la acción anunciada si acaso llega a un nodo del juego en que le toca jugarla. Una forma de seleccionar entre equilibrios, es eliminando aquellos que contienen estrategias no creíbles. Antes de precisar el concepto, es preciso contar con algunas definiciones.
Definición 14.- Un subárbol del juego es el subconjunto de nodos y acciones de un juego que se origina en un conjunto de información que es un singleton.
Ejemplo 12.- En el juego de la moneda, izquierda, hay 3 subárboles. El juego de la moneda, derecha solo tiene un subárbol.
Consideremos una combinación de estrategias en un juego. Al considerar un subárbol del juego, se puede definir un subjuego del juego original, que corresponde al juego restringido al subárbol.
Definición 15.- Un equilibrio de Nash es perfecto en el subjuego (EPS) si al considerar cada subárbol, la combinación de estrategias restringidas al subárbol es un equilibrio de Nash del juego restringido al subárbol.
En la definición anterior se utiliza la llamada racionalidad secuencial, en la que los jugadores juegan en forma óptima en cada nodo del juego.
Ejemplo 13.- En el juego de entrada de competencia (figura 4), la combinación de estrategias (NE,G) es un equilibrio de Nash pero no es perfecto en el subjuego.
Para encontrar los EPS basta utilizar el método de inducción hacia atrás. Se parte desde los nodos penúltimos y se elige en cada nodo la mejor acción (un problema de teoría de decisiones, ya que hay un solo jugador). Se reemplaza el juego original por uno en que se eliminan los nodos terminales y los nodos penúltimos se transforman en los nodos terminales de un juego simplificado, con los valores asociado a la mejor estrategia a usar en cada nodo penúltimo. Se prosigue hasta terminar el juego. Este procedimiento lleva a una solución única (salvo que los pagos a los jugadores sean los mismos en nodos distintos).
Ejemplo 14.- En la figura 5, podemos mostrar que existe un equilibrio (en estrategias puras) en que el jugador 3 obtiene un pago de 6, pero que no es EPS.
Figura 6: El juego del ultimátum.
El juego del ultimátum ha sido estudiado en experimentos. En estos experimentos, a voluntarios se les paga una suma fija por participar además de sumas variables que dependen de cuán bien juegan contra sus contrincantes. El juego del ultimátum ha sido bien estudiado, y los resultados muestran que en general, la oferta del primer jugador corresponde a x 2 [35%; 45%]. ¿Cómo se explica la diferencia con los resultados que se obtienen en el EPS del juego? Una posibilidad es que los pagos del juego no reflejen la utilidad que recibe el jugador 2 que sabe que el otro jugador es egoísta y se queda con la mayor parte de la suma a dividir. De acuerdo a este razonamiento, la equidad (que el jugador 1 no se aproveche) es un factor importante en la decisión de 2, y como 1 lo sabe, no se atreve a sacar toda la ventaja que podría obtener. Sin embargo, cuando las sumas son mucho mayores que aquellas de los experimentos (normalmente $15-30), los resultados tienden a parecerse a lo que predice el juego. En un gedanken-experiment, si la suma a dividir es $100.000, ¿cuántos de nosotros estaríamos dispuestos a perder $5.000 (por ejemplo) para mostrarle al jugador 1 que no hizo una división justa?
La idea de racionalidad secuencial se puede aplicar incluso cuando no todos los nodos son singletons. Consideremos el juego de entrada de competencia II que se muestra en la figura 10. En este caso, si el entrante decide entrar, puede elegir entre una guerra de precios y acomodar, y el jugador monopolista debe elegir, en forma simultánea, qué hacer. Existen tres equilibrios a este juego:
((No Entra, Acomodar si Entra), Guerra)
((No Entra, Guerra si Entra), Guerra)
((Entra, Acomodar si Entra), Acomodar)
de los cuales, sólo el último es EPS.
El mecanismo de inducción inversa (y por lo tanto, el concepto de EPS) tiene algunas limitaciones como se muestra en el juego del ciempiés, figura 8. En este caso, a ambos jugadores les convendría colaborar y conseguir llegar al menos cerca del final, y parece razonable que así lo hagan, pero el único EPS es uno en que ambos jugadores siempre usan la estrategia de parar (P) cuando les toca jugar. El problema parece ser que la inducción inversa es demasiado exigente respecto a la racionalidad de los agentes, pero la solución a este problema está aún abierta.
En el siguiente caso, que se muestra en figura 9, se trata de un juego similar al de entrada de competencia. En este caso hay un monopolio a lo largo del país, que enfrenta potenciales entrantes en 20 localidades, uno tras otro. En cada uno de ellos se encuentra en la situación del juego de entrada de competencia, figura 4. Al resolver el juego por inducción inversa obtenemos que todos los entrantes entran y el monopolio nunca reacciona, lo que es poco realista. Es más razonable pensar que el monopolio al principio utilizaría la estrategia de guerra a los entrantes, hasta crearse una reputación de agresividad, y sólo cerca del final del juego estaría dispuesto a aceptar la entrada.
Otro problema del EPS es la debilidad del concepto en los casos de información imperfecta. En este caso, algunos de los conjuntos de información contienen más de un elemento (no son singletons), por lo que el número de subárboles puede ser mucho menor que el número de nodos, o incluso puede existir un solo subárbol, como en el juego de la moneda, figura derecha. Al no existir subárboles, no podemos desagregar el juego, por lo que el concepto de EPS pierde su capacidad para eliminar equilibrios de Nash que no son creíbles. Consideremos, por ejemplo, una modificación menor del juego del ultimátum II. En este juego, que es, desde el punto de vista del jugador m, igual al anterior, existe un solo subjuego, por lo que el criterio de EPS no tiene ninguna utilidad para elegir entre los dos equilibrios de Nash del juego.
Ejemplo 15.- Consideremos el juego de entrada de competencia III que se muestra en la figura 11. En este juego el monopolista puede invertir en tecnología, a un costo de $20 antes de que haya entrada. Si no lo hace, estamos de vuelta en el juego de la figura 4. Si lo hace, es más eficiente en caso de guerra comercial, como lo muestra el subárbol del lado izquierdo para el caso de guerra. Claro que si no hay guerra esa tecnología no es necesaria, pero el costo de realizar las inversiones necesarias para estar preparados para la guerra reduce las utilidades.
El único EPS en este caso es s*1 = (I, G, A); s*2 = (NE, E), donde los nodos se han ordenado en forma natural. El resultado es que no hay entrada y la tecnología (o capacidad) no se utiliza. Su único objeto fue asustar a la potencial competencia.
Lo más interesante del caso anterior es lo que sucede si la inversión en tecnología no es observable, es decir, si la firma entrante no puede determinar a ciencia cierta si el monopolio realmente realizó la inversión (por lo que tiene un único conjunto de información que contiene a sus dos nodos de acción). En este caso, la firma entrante tiene dos estrategias puras (contra 4 antes): las de entrar o no hacerlo. Pero entonces la estrategia del monopolio s1 = (I, G ,A) no es mejor respuesta a una estrategia pura del entrante de s2 = NE, porque en ese caso le conviene no invertir. Ahora, supongamos que el entrante anuncia s2 = E. ¿Que puede hacer el monopolio? Si invierte, el entrante entra, y termina en guerra, obteniendo 10. Si no lo hace, termina acomodando la entrada con 20. Por lo tanto, no invierte y acomoda. En consecuencia, la amenaza del entrante es creíble y el entrante maximiza y se trata de un EPS. Lo sorprendente de este caso es que al entrante le conviene no saber lo que ha hecho el monopolista, porque si lo supiera (y el monopolista sabe que el entrante sabe) no entraría, ya que el monopolista haría las inversiones.
3.6.- Juegos de información incompleta e imperfecta.
Se dice que un juego es de información imperfecta cuando algunos de los conjuntos de información del juego tienen más de un nodo. Un juego es de información incompleta cuando los jugadores no conocen todas las características del juego, en particular, los pagos que reciben otros jugadores. De acuerdo a lo que hemos visto hasta ahora, los juegos de este último tipo no pueden ser estudiados, ya que hemos supuesto que en los juegos, toda la información sobre la estructura del juego es conocida por los participantes.
Ejemplo 16.- Consideremos el juego siguiente (Fudenberg-Tirole, 1993), que es similar al problema de entrada de competencia, figura 4.
El jugador 1 tiene que decidir si construir una planta, mientras el jugador 2 debe decidir si entra o no. El problema es que el jugador 2 no sabe si los costes del jugador 1 son 1,5 o 3, mientras que éste si lo sabe.
Si los costes del jugador 1 son altos (cuadro izquierdo), su estrategia dominante es no construir. En cambio, si su coste es bajo, la estrategia óptima del jugador 1 depende de su predicción de y, la probabilidad que el jugador 2 entre. Es mejor construir si 1,5y + 3,5(1 - y) > 2y + 3(1- y), es decir, y < 1/2. En otras palabras, el jugador 1 tiene que tratar de predecir el comportamiento del jugador 2, pero éste no puede inferir la acción del jugador 1 a partir de su conocimiento de los pagos.
Harsany (1967) propuso transformar los juegos de información incompleta en juegos de información imperfecta. Supongamos que introducimos un jugador adicional, que denominamos Naturaleza, que recibe el mismo pago en todos los estados. Naturaleza elige un tipo de jugador 1, es decir un jugador 1 con uno de los posibles valores alternativos en los nodos terminales del juego (sus costes, en el caso del juego anterior). El nuevo juego, llamado juego Bayesiano, se ha transformado desde un juego de información incompleta en un juego de información imperfecta, el que cabe dentro del marco de Teoría de Juegos conocida (ver figura 13). En el contexto de juegos estáticos (de jugadas simúltaneas), si i i es un tipo del jugador i, una estrategia (o regla de decisión) del jugador si (thetai) es una regla que le dice que hacer para cada realización de sus tipos. Ahora el jugador debe maximizar el valor esperado de sus tipos, dado las distribuciones de tipos de los demás. El equilibrio de Bayes-Nash es un equilibrio en que cada jugador maximiza esta utilidad esperada dadas las reglas de decisión de los demás jugadores.
En el caso de juegos dinámicos, se pueden definir los equilibrios de Bayes-Nash como un par ordenado compuesto por una combinación de estrategias y un sistema de creencias. Las creencias son probabilidades asignadas a cada nodo en un conjunto de información. Un jugador que le toca jugar en un conjunto de información H, con nodos le asigna una probabilidad a la ocurrencia de cada nodo de H. Se dice que una combinación de estrategias es secuencialmente racional (dadas las creencias ) si en cada conjunto de información, el jugador que le toca jugar maximiza su utilidad esperada, dado . Para motivar la definición de consistencia de las creencias, notemos que, dada una combinación de estrategias , la probabilidad condicional de alcanzar el nodo x en el conjunto de información H es (por la regla de Bayes).
El equilibrio (débil) de Bayes-Nash satisface:
1. Dadas las creencias, la estrategia de cada jugador es secuencialmente racional (mejor respuesta).
2. Las estrategias son consistentes desde un punto de vista Bayesiano; es decir, las creencias están actualizadas de acuerdo a la regla de Bayes en los nodos alcanzados en el juego.
Téngase en cuenta que cuando los costes del jugador 1 son altos, es preferible no construir (es una estrategia dominante). Sea x la probabilidad de construir cuando los costes son bajos. Entonces la estrategia óptima del jugador 2 es y = 1 (entrar) si x < 1/[2(1 -p1)], y = 0 (no entrar) si x > 1/[2(1 - p1)], e y [0; 1] si x = 1/[2(1- p1)]. Asimismo, la estrategia que es mejor respuesta para el jugador 1 es x = 1 (construir) si y > 1/2, x = 0 si y < 1/2 y x [0; 1] si y = 1/2.
La búsqueda del equilibrio se basa en encontrar x e y tal que x sea óptima para el jugador 1 con bajo coste contra el jugador 2 e y sea óptima para el jugador 2 contra el jugador 1 dadas las creencias p1 y la estrategia del jugador 1. Por ejemplo, la estrategia x = 0; y = 1 es un equilibrio para todo p1 y la estrategia x = 1; y = 0 es un equilibrio si y solo si p < 1/2.
En todo caso, la definición que hemos dado de equilibrio de Bayes-Nash es débil porque no hemos impuesto condiciones sobre las creencias en nodos que no son alcanzados con probabilidad positiva, y sin embargo estas creencias pueden afectar a las estrategias. La noción de equilibrio secuencial es una forma de restringir las creencias en esos nodos de manera que no se produzcan inconsistencias.
-TEORÍA DE JUEGOS-
17
Descargar
Enviado por: | Javier Abellán Lucas |
Idioma: | castellano |
País: | España |