jueves, 12 de abril de 2018

2ª Sesión: Representación de juegos en forma normal y forma extensiva.

En esta segunda sesión, la hemos iniciado repasando los conceptos básicos de la teoría de juegos, para ello hemos visto el juego más clásico que para entender la Teoría de Juegos: "El dilema del prisionero".

El dilema del prisionero nos muestra la situación en la que dos delincuentes han sido detenidos por la policía por cometer delitos menores, pero saben que han cometido delitos mayores sin embargo le faltan pruebas para declararlos culpables. Por ello, los separan en celdas distintas donde no se puedan comunicar entre ellos, y los interrogan para que confiesen todo lo que han hecho.Para ello se les presenta la siguiente matriz de pagos: 


Prisionero 1
No delatar Delatar
Prisionero 2 No delatar (-2,-2) (-1,-10)
Delatar (-10,-1) (-6,-6)

Esta es la matriz de pagos, presentada para la forma normal del juego, donde los dos jugadores deciden de forma simultánea. Gracias a esta matriz podemos observar que a los dos prisioneros les conviene no confesar si sumamos los castigos, pues solo les caería dos años de cárcel para cada.sin embargo, los dos tienen incentivos individuales a confesar para que les caiga  un solo año de cárcel, y para evitar el riesgo de que el otro compañero confiese y ellos no, por lo tanto le caigan 10 años. 

En conclusión tendremos que al final los dos prisioneros elegirán declarar como equilibrio, a pesar que para los dos sería conveniente cooperar  entre ellos y no confesar. 


2ª Parte:  Juegos de simultáneos vs secuenciales.


El profesor nos ha explicado la diferencia entre juegos simultáneos y juegos secuenciales:  

Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los que éstos desconocen los movimientos anteriores de otros jugadores, ejemplo Dilema del prisionero.

Los juegos secuenciales (o dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones previas.

Este conocimiento no necesariamente tiene que ser perfecto; sólo debe consistir en algo de información.

Por ejemplo, un jugador 1 puede conocer que un jugador 2 no realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.

La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar juegos simultáneos, y la extensiva para representar juegos secuenciales.


En el juego que se muestra en el ejemplo hay dos jugadores. El jugador 1 mueve primero y elige F o U. El jugador 2 ve el movimiento del jugador 1 y elige A o R. Si el jugador 1 elige U y entonces el jugador 2 elige A, entonces el jugador 1 obtiene 8 y el jugador 2 obtiene 2

El equilibrio será que el jugador elija U, pues sabe que puede ganar 8 en lugar de 5, ya que el jugador 2, independientemente de las dos opciones elegidas por 1, siempre va a elegir la opción aceptar, ya que 5 es mayor que 0, y 2 es mayor que 0 en sus pagos. 


3ª Parte: Experimentación de los  árboles de decisión

Hemos puesto en práctica los árboles de decisión mediante dos juegos, el ajedrez, y el juego del dictador ampliado:

Se hacen 4 grupos sociales. Cada grupo elegirá a su dictador.

En cada ronda un grupo distinto será el dictador, los turnos de los grupos se hacen al azar lanzando un dado. El resto de los grupos sociales están bajo los dominios del dictador.

El dictador recibe en su turno 100 millones de euros, por cada grupo, que tiene que repartir a su voluntad sin negociación, entre él y el grupo de súbditos, tiene 100 posibilidades distintas, que van de todo para él y nada al pueblo (100,0) a nada para él y todo para el pueblo (0,100).

Una vez que haya decidido los pagos a cada grupo estos los publicará, y cada grupo debe elegir si aceptar su pago y el del dictador, o hacer rebelión y en dicho caso el grupo y el dictador no ganarán nada, es decir (0,0).

Gana el grupo que más beneficio obtenga en las 4 rondas. 


Resultado: Todos los equipos han hecho repartos distintos a cada grupo social en su turno, pero todos los dictadores han ofrecido una cantidad mínima a todos sus súbditos para no recibir rechazo, que ha sido superior a 0, pero inferior a 50.

Ha ganado el equipo que menos ha hecho rebelión, y que no le han rechazado.




Conclusiones: En este juego el equilibrio está en ofrecer una cantidad inferior a 50 pero próxima a todos los grupos por parte del dictador,de esta forma no se obtiene rechazo, pues hay incentivos a pensar en los demás para que estos acepten las cantidades y luego nos traten bien en las siguientes rondas.

Juego del ajedrez: 

Observamos que el juego del ajedrez también es un secuencial por turnos, donde primero juegan las blancas y después las negras. Nada más en la primera jugada, las blancas ya tienen 20 movimientos posibles, considerando los dos movimientos de los 8 peones, y los dos movimientos de los dos caballos.

Por ello a la hora de elaborar árboles de decisiones van a ser mucho más complejos, pues cada rama se va multiplicando por varias jugadas. Por lo que el cálculo de todas las posibles jugadas nos daría un árbol de un tamaño enorme imposible de hacer por un humano.

Observamos también que el juego del ajedrez tiene solución, pero son tan amplias las soluciones que ninguna maquina ni mente humana ha podido encontrarla todavía por el momento. Lo cual hace que siga siendo divertido y se puede jugar solo aplicando pequeños árboles de decisión como hemos hecho.