jueves, 26 de abril de 2018

4ª Sesión: Sistema de inducción hacia atrás y estrategias puras vs estrategias mixtas.

Esta sesión la hemos dividido en varias partes:


1ª Parte: Sistema de inducción hacia atrás.


La Inducción hacia atrás es el proceso de razonar atrás en el tiempo, desde el final de un problema o situación, para determinar una secuencia de acciones óptimas.

Se procede, en primer lugar tomando en cuenta la última vez que se llevo a cabo una decisión y se elige qué hacer en ese momento. Con esta información, se puede entonces determinar lo que debería hacer en la penúltima decisión. Este proceso continúa atrás hasta que se ha determinado la mejor acción para cada situación posible (es decir, para cada posible conjunto de información) en cada punto en el tiempo.

Aplicación de la inducción hacia atrás a los juegos de mesa. 

Hay juegos como las damas y el ajedrez que se caracterizan por ser juegos finitos con información perfecta. El poder aplicarles la inducción hacia atrás permite encontrar los resultados perfectos en subjuegos, esto tiene gran relevancia respecto a la búsqueda de buenas estrategias de juego. Si enfrentásemos a un jugador cualquiera, contra un ordenador capaz de aplicar el algoritmo de inducción hacia atrás a juegos tan complejos como el ajedrez o las damas, nuestro jugador saldría siempre perdedor. Puesto que, el ordenador sabría que estrategia jugar en cada momento del juego para alcanzar la victoria.



Caso: paradoja del ahorcado.


Para practicar la inducción hacia atrás hemos analizado la paradoja del ahorcado:

Supongamos que a un prisionero se le dice que será ahorcado en algún momento entre el lunes y el viernes de la próxima semana. Sin embargo, el día exacto será una sorpresa (es decir, no sabrá la noche anterior que será ejecutado al día siguiente).

Entre todos aplicando la inducción hacia atrás hemos llegado a la solución del prisionero


El prisionero, interesado en burlar a su verdugo, intenta determinar qué día ocurrirá la ejecución. El razona que no puede ocurrir el viernes, ya que si no hubiera ocurrido antes del final del jueves, sabría que la ejecución sería el viernes. Por lo tanto, el puede eliminar el viernes como una posibilidad. Con el viernes eliminado, decide que no puede ocurrir el jueves, ya que si no hubiera ocurrido el miércoles, el sabría que tenía que ser el jueves. Por lo tanto, el puede eliminar el jueves. Este razonamiento continúa hasta que haya eliminado todas las posibilidades. El concluye que no será ahorcado la próxima semana.


Sin embargo, esto no es lo que sucede, la verdadera solución es la siguiente:

Para su sorpresa, le cuelgan el miércoles. Cometió el error de suponer que sabía de manera definitiva si el factor futuro desconocido que podría causar su ejecución podía razonar. Aquí el prisionero razona por inducción hacia atrás, pero parece llegar a una conclusión falsa. Sin embargo, tenga en cuenta que la descripción del problema supone que es posible sorprender a alguien que está realizando una inducción hacia atrás. La teoría matemática de la inducción hacia atrás no hace esta suposición, por lo que la paradoja no cuestiona los resultados de esta teoría.


2ª Parte: Estrategias puras vs Estrategias mixtas.

En esta segunda parte de la tarde hemos visto la diferencia entre las estrategias puras y las estrategias mixtas.

Estrategia pura es un término empleado para designar un tipo de estrategias en teoría de juegos. Cada jugador tiene a su disposición un conjunto de estrategias. Si un jugador elige una acción con probabilidad 1 entonces está jugando una estrategia pura.

Esto la diferencia de la estrategia mezclada o mixta, donde jugadores individuales eligen una distribución de probabilidad sobre muchas acciones.
Ejemplo: juego, piedra, papel, tijera.


Consideremos el juego piedra, papel o tijera con la matriz de pagos dada por:


Piedra
Papel
Tijera
Piedra
0
-1
+1
Papel
+1
0
-1
Tijera
-1
+1
0

Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podría sacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategias mixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a la distribución elegida.


Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne más probabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. De éste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cada estrategia (siempre y cuando se mantengan los pagos dados por la matriz). 

Práctica: Nos hemos dividido en parejas y hemos jugado al piedra, papel o tijera.En total hemos jugado 20 turnos. En los primeros turnos las victorias han sucedido por azar. Sin embargo, al avanzar en el juego, en las parejas donde un jugador ha llevado una estrategia más pura ha sido derrotado por su rival, mientras que en las parejas donde los jugadores han llevado estrategias aleatorias mixtas se han producido resultados parejos y no ha habido un claro vencedor.

Otro ejemplo: Lanzamiento de penaltis.

En el mundo del fútbol sabemos que a la hora de lanzar un penalty, cuando el portero estudia y conoce si el lanzador es diestro o zurdo y suele tener la tendencia a lanzar a su lado bueno, el portero va a apostar por lanzarse hacia ese lado más frecuentemente porque la probabilidad de pararlo es mayor. 

Práctica: Juego del mentiroso.

Para finalizar la sesión hemos jugado al juego del mentiroso con dos barajas españolas en dos grupos por separado.

Este juego consiste en repartir todas las cartas en un número igual dividido entre los participantes. Las cartas de la mano no las pueden ver el resto de los jugadores. Un jugador empieza lanzando una carta o dos boca abajo, y diciendo el número de la carta. El jugador que está a su derecha tiene dos opciones, o bien lanzar otra carta más de ese mismo número boca abajo para descartarse o bien levantar la carta del jugador de la izquierda si piensa que es mentira,y que no se corresponde a esos números. Si levanta la carta y había dicho la verdad, se queda con todas las cartas del montón, si levanta la carta y era mentira el último lanzamiento, se queda el montón de cartas el último mentiroso. El juego lo gana aquel jugador que consigue quedarse sin cartas antes.

Resultados de la partida: Al principio, en las primeras partidas, el jugador que ha ganado ha sido aquel que tenía a su derecha y elegía la estrategia pura de creer. Esto ha hecho que pudiera mentir.

A medida que se han ido jugando partidas, los resultados han sido más equilibrados, y ha dependido del azar y de otro factor.El psicológico, pues un jugador aunque tenga estrategias mixtas puede ser descubierto como mentiroso por algún gesto que lo delate.  En este tipo de juegos no se puede tener en cuenta solo las matemáticas, también existe un factor humano para ganar.







jueves, 19 de abril de 2018

3ª Sesión: Elaboración de árboles de decisión teniendo en cuenta la probabilidad.

En esta sesión hemos repasado la forma extensiva para los juegos secuenciales con dos jugadores, y hemos introducido el factor probabilidad con un nuevo caso.

En lugar de tener dos jugadores, el segundo nodo del árbol de decisión va  a ser un suceso aleatorio donde hay que tener presente la probabilidad.

Para poder comparar las distintas opciones y posibles resultados debemos tener en cuenta la regla de Laplace, dicha regla nos permite calcular la probabilidad de forma sencilla, es decir, la división de los casos favorables de un suceso entre los casos posibles. Por ejemplo, si tenemos el proceso aleatorio de lanzamiento de un dado normal, y definimos al caso A como que salga el número 3,  tendríamos que dividir 1,que el número de caras en las que aparece el 3, entre 6, que es el número de caras todas que tiene el dado, y por lo tanto el número de casos posibles.

Visto esto se puede calcular la esperanza de tener beneficios en cada decisión del jugador 1, multiplicando los beneficios posibles por su probabilidad y sumándolas.Sin embargo, este criterio es subjetivo, pues al encontrarnos con procesos aleatorios nos tenemos que enfrentar al azar. Por ello, una solución será más óptima o menos óptima dependiendo de la aversión al riesgo.

Juego práctico.

Para estudiar este tipo de situaciones hemos usado el juego de emprendedores del kit de economía de LaCaixa.

En dicho juego los participantes empiezan siendo empresarios autónomos con 10 monedas de capital inicial cada uno, tienen que tomar decisiones de inversión de tres tipos de productos distintos:

1. Producto común, que son productos poco rentables pero con una alta probabilidad de que tenga ventas.

2. Producto específico, son productos medios donde se obtiene algo de más rentabilidad que los productos comunes, pero sin embargo se corre más riesgo de que no haya ventas adecuadas.

3. Productos novedosos, son muy rentables si tienen buena acogida de mercado, sin embargo, tienen una alta probabilidad de fracasar en las ventas.





Los jugadores deben de colocar sus fichas en los productos valorando las probabilidades con el objetivo de obtener más beneficios y crecer como empresas. Para saber si un producto tiene éxito o fracaso en el mercado se lanza un dado, tomando como criterio los siguientes:

Producto común: éxito de ventas si sale del 1 al 4, fracaso si sale el 5 o 6.

Producto específico: éxito de ventas si sale del 1 al 3, fracaso si sale del 4 al 5.

Producto novedoso: éxito de ventas si sale de 1 o 2, fracaso si sale del 3 al 6.




Resultados del juego: Los equipos que han tomando decisiones más arriesgadas en general han tenido mayores pérdidas,especialmente aquellos equipos que han elegido siempre los productos novedosos.  Los equipos que han sabido diversificar el riesgo, y alternar elección arriesgadas con otras más conservadoras han obtenido mayores resultados.




jueves, 12 de abril de 2018

2ª Sesión: Representación de juegos en forma normal y forma extensiva.

En esta segunda sesión, la hemos iniciado repasando los conceptos básicos de la teoría de juegos, para ello hemos visto el juego más clásico que para entender la Teoría de Juegos: "El dilema del prisionero".

El dilema del prisionero nos muestra la situación en la que dos delincuentes han sido detenidos por la policía por cometer delitos menores, pero saben que han cometido delitos mayores sin embargo le faltan pruebas para declararlos culpables. Por ello, los separan en celdas distintas donde no se puedan comunicar entre ellos, y los interrogan para que confiesen todo lo que han hecho.Para ello se les presenta la siguiente matriz de pagos: 


Prisionero 1
No delatar Delatar
Prisionero 2 No delatar (-2,-2) (-1,-10)
Delatar (-10,-1) (-6,-6)

Esta es la matriz de pagos, presentada para la forma normal del juego, donde los dos jugadores deciden de forma simultánea. Gracias a esta matriz podemos observar que a los dos prisioneros les conviene no confesar si sumamos los castigos, pues solo les caería dos años de cárcel para cada.sin embargo, los dos tienen incentivos individuales a confesar para que les caiga  un solo año de cárcel, y para evitar el riesgo de que el otro compañero confiese y ellos no, por lo tanto le caigan 10 años. 

En conclusión tendremos que al final los dos prisioneros elegirán declarar como equilibrio, a pesar que para los dos sería conveniente cooperar  entre ellos y no confesar. 


2ª Parte:  Juegos de simultáneos vs secuenciales.


El profesor nos ha explicado la diferencia entre juegos simultáneos y juegos secuenciales:  

Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los que éstos desconocen los movimientos anteriores de otros jugadores, ejemplo Dilema del prisionero.

Los juegos secuenciales (o dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones previas.

Este conocimiento no necesariamente tiene que ser perfecto; sólo debe consistir en algo de información.

Por ejemplo, un jugador 1 puede conocer que un jugador 2 no realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.

La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar juegos simultáneos, y la extensiva para representar juegos secuenciales.


En el juego que se muestra en el ejemplo hay dos jugadores. El jugador 1 mueve primero y elige F o U. El jugador 2 ve el movimiento del jugador 1 y elige A o R. Si el jugador 1 elige U y entonces el jugador 2 elige A, entonces el jugador 1 obtiene 8 y el jugador 2 obtiene 2

El equilibrio será que el jugador elija U, pues sabe que puede ganar 8 en lugar de 5, ya que el jugador 2, independientemente de las dos opciones elegidas por 1, siempre va a elegir la opción aceptar, ya que 5 es mayor que 0, y 2 es mayor que 0 en sus pagos. 


3ª Parte: Experimentación de los  árboles de decisión

Hemos puesto en práctica los árboles de decisión mediante dos juegos, el ajedrez, y el juego del dictador ampliado:

Se hacen 4 grupos sociales. Cada grupo elegirá a su dictador.

En cada ronda un grupo distinto será el dictador, los turnos de los grupos se hacen al azar lanzando un dado. El resto de los grupos sociales están bajo los dominios del dictador.

El dictador recibe en su turno 100 millones de euros, por cada grupo, que tiene que repartir a su voluntad sin negociación, entre él y el grupo de súbditos, tiene 100 posibilidades distintas, que van de todo para él y nada al pueblo (100,0) a nada para él y todo para el pueblo (0,100).

Una vez que haya decidido los pagos a cada grupo estos los publicará, y cada grupo debe elegir si aceptar su pago y el del dictador, o hacer rebelión y en dicho caso el grupo y el dictador no ganarán nada, es decir (0,0).

Gana el grupo que más beneficio obtenga en las 4 rondas. 


Resultado: Todos los equipos han hecho repartos distintos a cada grupo social en su turno, pero todos los dictadores han ofrecido una cantidad mínima a todos sus súbditos para no recibir rechazo, que ha sido superior a 0, pero inferior a 50.

Ha ganado el equipo que menos ha hecho rebelión, y que no le han rechazado.




Conclusiones: En este juego el equilibrio está en ofrecer una cantidad inferior a 50 pero próxima a todos los grupos por parte del dictador,de esta forma no se obtiene rechazo, pues hay incentivos a pensar en los demás para que estos acepten las cantidades y luego nos traten bien en las siguientes rondas.

Juego del ajedrez: 

Observamos que el juego del ajedrez también es un secuencial por turnos, donde primero juegan las blancas y después las negras. Nada más en la primera jugada, las blancas ya tienen 20 movimientos posibles, considerando los dos movimientos de los 8 peones, y los dos movimientos de los dos caballos.

Por ello a la hora de elaborar árboles de decisiones van a ser mucho más complejos, pues cada rama se va multiplicando por varias jugadas. Por lo que el cálculo de todas las posibles jugadas nos daría un árbol de un tamaño enorme imposible de hacer por un humano.

Observamos también que el juego del ajedrez tiene solución, pero son tan amplias las soluciones que ninguna maquina ni mente humana ha podido encontrarla todavía por el momento. Lo cual hace que siga siendo divertido y se puede jugar solo aplicando pequeños árboles de decisión como hemos hecho.




jueves, 5 de abril de 2018

1ª Sesión: Presentación de la Teoría de Juegos.

En esta primera sesión nos hemos embarcado en el proyecto ilusionante de pasádnoslo muy bien aplicando el pensamiento matemático a distintos juegos. Iniciamos el proyecto con mucha ilusión.

Nuestro profesor nos ha presentado y explicado lo que vamos a hacer durante estas 8 sesiones que dura el proyecto, comentando cuales son los objetivos a alcanzar, que se pueden consultar en la cabecera de arriba de este blog.

También hemos señalado en el calendario las fechas de las reuniones,el día de la semana y el lugar:

Lugar: I.E.S El Palmeral
Día y hora de la semana: Jueves, 17:00 horas.
Fechas de las sesiones:  5 de abril, 12 de abril, 19 de abril, 26 de abril, 3 de mayo, 10 de mayo, 17 de mayo, 24 de mayo.



Lo primero que hemos  visto es en  qué consiste la teoría de juegos, que es una  disciplina nueva en las matemáticas aplicadas que plantea como mediante el razonamiento matemático hay que tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en la situación ( o juego)  para la consecución de los objetivos. 

Posteriormente,hemos puesto en práctica los supuestos de la teoría de juegos mediante el juego titulado "Guerra de precios",  que es un juego de 4 equipos, donde cada equipo es una empresa de la misma industria, que se reparten la cuota de mercado. Todas las empresas tienen que tomar una decisión simultáneamente entre dos opciones, mantener precios o bien bajar precios, y hacer guerra de precios. En función de las decisiones que tome cada empresa y las que tomen las demás tendrán unos beneficios distintos tal y como muestra la siguiente matriz de resultados:

Matriz de resultados juego de guerra de precios
Escenarios Empresa A Empresa B Empresa C Empresa D Empresa A Empresa B Empresa C Empresa D Total B
1 No baja P No baja P No baja P No baja P 150 150 150 150 600
2 Baja P No baja P No baja P No baja P 400 25 25 25 475
3 Baja P Baja P No baja P No baja P 200 200 25 25 450
4 Baja P Baja P Baja P No baja P 100 100 100 25 325
5 Baja P Baja P Baja P Baja P 50 50 50 50 200

El juego se ha hecho para cinco rondas, proclamando vencedor al equipo que después de 5 rondas haya tenido más beneficios.

Para las tres primeras rondas, las decisiones se han tomado sin negociación, es decir, lo equipos no podían hablar entre sí.

Sin embargo, en las dos últimas rondas sí que se podía negociar y pactar estrategias antes de tomar la decisión.

Resultado: Ha ganado el equipo que más veces ha bajado los precios.

Conclusiones: Existe una solución de equilibrio, que es que todos las empresas bajen precios, pues hay más incentivos de bajar los precios según los pagos, y se corre un riesgo muy alto de esperar de que los competidores no los bajen.

Sin embargo, la mejor decisión para que todos tuvieran mayores beneficios es que todos mantuvieran los precios altos y no se hiciera guerra de precios.

En las rondas donde existe negociación se intentaron mantener los precios y se hicieron pactos, pero después no se cumplieron porque no hay incentivos ni mecanismos de sanción para cumplirlos.