jueves, 26 de abril de 2018

4ª Sesión: Sistema de inducción hacia atrás y estrategias puras vs estrategias mixtas.

Esta sesión la hemos dividido en varias partes:


1ª Parte: Sistema de inducción hacia atrás.


La Inducción hacia atrás es el proceso de razonar atrás en el tiempo, desde el final de un problema o situación, para determinar una secuencia de acciones óptimas.

Se procede, en primer lugar tomando en cuenta la última vez que se llevo a cabo una decisión y se elige qué hacer en ese momento. Con esta información, se puede entonces determinar lo que debería hacer en la penúltima decisión. Este proceso continúa atrás hasta que se ha determinado la mejor acción para cada situación posible (es decir, para cada posible conjunto de información) en cada punto en el tiempo.

Aplicación de la inducción hacia atrás a los juegos de mesa. 

Hay juegos como las damas y el ajedrez que se caracterizan por ser juegos finitos con información perfecta. El poder aplicarles la inducción hacia atrás permite encontrar los resultados perfectos en subjuegos, esto tiene gran relevancia respecto a la búsqueda de buenas estrategias de juego. Si enfrentásemos a un jugador cualquiera, contra un ordenador capaz de aplicar el algoritmo de inducción hacia atrás a juegos tan complejos como el ajedrez o las damas, nuestro jugador saldría siempre perdedor. Puesto que, el ordenador sabría que estrategia jugar en cada momento del juego para alcanzar la victoria.



Caso: paradoja del ahorcado.


Para practicar la inducción hacia atrás hemos analizado la paradoja del ahorcado:

Supongamos que a un prisionero se le dice que será ahorcado en algún momento entre el lunes y el viernes de la próxima semana. Sin embargo, el día exacto será una sorpresa (es decir, no sabrá la noche anterior que será ejecutado al día siguiente).

Entre todos aplicando la inducción hacia atrás hemos llegado a la solución del prisionero


El prisionero, interesado en burlar a su verdugo, intenta determinar qué día ocurrirá la ejecución. El razona que no puede ocurrir el viernes, ya que si no hubiera ocurrido antes del final del jueves, sabría que la ejecución sería el viernes. Por lo tanto, el puede eliminar el viernes como una posibilidad. Con el viernes eliminado, decide que no puede ocurrir el jueves, ya que si no hubiera ocurrido el miércoles, el sabría que tenía que ser el jueves. Por lo tanto, el puede eliminar el jueves. Este razonamiento continúa hasta que haya eliminado todas las posibilidades. El concluye que no será ahorcado la próxima semana.


Sin embargo, esto no es lo que sucede, la verdadera solución es la siguiente:

Para su sorpresa, le cuelgan el miércoles. Cometió el error de suponer que sabía de manera definitiva si el factor futuro desconocido que podría causar su ejecución podía razonar. Aquí el prisionero razona por inducción hacia atrás, pero parece llegar a una conclusión falsa. Sin embargo, tenga en cuenta que la descripción del problema supone que es posible sorprender a alguien que está realizando una inducción hacia atrás. La teoría matemática de la inducción hacia atrás no hace esta suposición, por lo que la paradoja no cuestiona los resultados de esta teoría.


2ª Parte: Estrategias puras vs Estrategias mixtas.

En esta segunda parte de la tarde hemos visto la diferencia entre las estrategias puras y las estrategias mixtas.

Estrategia pura es un término empleado para designar un tipo de estrategias en teoría de juegos. Cada jugador tiene a su disposición un conjunto de estrategias. Si un jugador elige una acción con probabilidad 1 entonces está jugando una estrategia pura.

Esto la diferencia de la estrategia mezclada o mixta, donde jugadores individuales eligen una distribución de probabilidad sobre muchas acciones.
Ejemplo: juego, piedra, papel, tijera.


Consideremos el juego piedra, papel o tijera con la matriz de pagos dada por:


Piedra
Papel
Tijera
Piedra
0
-1
+1
Papel
+1
0
-1
Tijera
-1
+1
0

Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.


Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne más probabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos dados por la matriz). 

Práctica: Nos hemos dividido en parejas y hemos jugado al piedra, papel o tijera.En total hemos jugado 20 turnos. En los primeros turnos las victorias han sucedido por azar. Sin embargo, al avanzar en el juego, en las parejas donde un jugador ha llevado una estrategia más pura ha sido derrotado por su rival, mientras que en las parejas donde los jugadores han llevado estrategias aleatorias mixtas se han producido resultados parejos y no ha habido un claro vencedor.

Otro ejemplo: Lanzamiento de penaltis.

En el mundo del fútbol sabemos que a la hora de lanzar un penalty, cuando el portero estudia y conoce si el lanzador es diestro o zurdo y suele tener la tendencia a lanzar a su lado bueno, el portero va a apostar por lanzarse hacia ese lado más frecuentemente porque la probabilidad de pararlo es mayor. 

Práctica: Juego del mentiroso.

Para finalizar la sesión hemos jugado al juego del mentiroso con dos barajas españolas en dos grupos por separado.

Este juego consiste en repartir todas las cartas en un número igual dividido entre los participantes. Las cartas de la mano no las pueden ver el resto de los jugadores. Un jugador empieza lanzando una carta o dos boca abajo, y diciendo el número de la carta. El jugador que está a su derecha tiene dos opciones, o bien lanzar otra carta más de ese mismo número boca abajo para descartarse o bien levantar la carta del jugador de la izquierda si piensa que es mentira,y que no se corresponde a esos números. Si levanta la carta y había dicho la verdad, se queda con todas las cartas del montón, si levanta la carta y era mentira el último lanzamiento, se queda el montón de cartas el último mentiroso. El juego lo gana aquel jugador que consigue quedarse sin cartas antes.

Resultados de la partida: Al principio, en las primeras partidas, el jugador que ha ganado ha sido aquel que tenía a su derecha y elegía la estrategia pura de creer. Esto ha hecho que pudiera mentir.

A medida que se han ido jugando partidas, los resultados han sido más equilibrados, y ha dependido del azar y de otro factor.El psicológico, pues un jugador aunque tenga estrategias mixtas puede ser descubierto como mentiroso por algún gesto que lo delate.  En este tipo de juegos no se puede tener en cuenta solo las matemáticas, también existe un factor humano para ganar.