La cooperación es siempre una mejor estrategia que la traición

La creencia de que la buena gente siempre terminan los últimos en el mercado, un campo de dura selección natural darwiniana, fue refutada hace muchos años. Sucedió con la aparición de un libro, tan innovador, que cambió la cosmovisión popular. Ese libro fue The Evolution of Cooperation escrito en 1984 por Robert Axelrod. Un trabajo fundamental que cambió la forma en que los expertos ven la cooperación. Sus ramificaciones se aplican a individuos, organizaciones, países e incluso formas de vida biológica no pensantes, pero cooperativas, como las bacterias. Axelrod basó su libro en el famoso Prisoner’s Dilemma, un juego clásico creado en 1950 por Merrill Flood y Melvin Dresher de Rand Corporation.

El matemático canadiense Albert W. Tucker agregó las recompensas de la pena de prisión y le dio al juego su original nombre. Los jugadores tienen dos opciones: cooperación o traición. Axelrod organizó dos torneos repetidos del Dilema del Prisionero, jugados por programas de ordenador ideados por teóricos de juegos, científicos y otros expertos. Su análisis de los resultados de los torneos confirmó que la cooperación es siempre una mejor estrategia a largo plazo que la traición y, por tanto, la evolución la ha favorecido. Este libro, basado en ese análisis, se ha convertido en un verdadero clásico.

Principales ideas de ‘The Evolution of Cooperation’

Las personas, los grupos, las organizaciones y las naciones pueden lograr una cooperación mutuamente satisfactoria basada en una estrategia sencilla y sensata.
La mejor estrategia para tratar con los demás a lo largo del tiempo es cooperar inicialmente y estar dispuesto a corresponder en especie, «ojo por ojo», si no se le trata correctamente.
La cooperación puede evolucionar en un entorno en gran medida poco cooperativo si al menos un pequeño grupo de personas continúa cooperando.
El perdón es tremendamente útil para promover la cooperación.
El dilema del prisionero, cooperar o no, ayuda a explicar la cooperación.
En el Dilema del Prisionero, la cooperación mutua paga dividendos más estables, pero la traición unilateral paga más, si puedes salirte con la tuya.
Debes cooperar si el otro jugador coopera.
El dilema del prisionero muestra que la cooperación se desarrolla mejor entre individuos que saben que necesitarán tratar entre ellos repetidamente en el futuro.
La cooperación puede desarrollarse entre enemigos mortales, incluso en circunstancias poco probables.
La cooperación es una estrategia tan eminentemente factible que no requiere previsión, amistad ni un ápice de inteligencia.

El dilema del prisionero

Considera la cooperación en algunas formas diferentes. Si tienes una relación a largo plazo con otra persona, ¿tiene más sentido en términos de tus metas personales cooperar con esa persona? ¿Obtienes alguna ventaja al mostrar bondad a alguien que nunca te corresponde? ¿Qué podría ganar tu empresa al trabajar con otra empresa si pronto se fuera a la quiebra? ¿Cómo debería reaccionar tu país ante una acción hostil abierta de una nación enemiga? ¿Puede tu país lidiar con este enemigo o manipularlo para que coopere? Una forma útil de representar y responder a estas preguntas es utilizar un «Dilema del prisionero» repetido (repetido).

«En el Dilema del Prisionero, la estrategia que funciona mejor depende directamente de la estrategia que esté usando el otro jugador y … si esta estrategia deja espacio para … la cooperación mutua».

El enigma original es: la policía captura a dos delincuentes y les ofrece un trato por separado. A los hombres no se les permite hablar. Si uno denuncia al otro y confiesa, será puesto en libertad y el otro recibirá una pena de prisión de 10 años. Si ambos permanecen en silencio, cada uno recibirá un período menor de seis meses. Si ambos informan en contra del otro, cada uno obtiene un plazo de dos años. El dilema es que, si ambos informan, cada uno gana menos que si permanece en silencio.

En la teoría de juegos, el dilema del prisionero proporciona nuevamente tres posibles resultados entre dos jugadores:

Ambos jugadores se benefician modestamente cuando cooperan entre sí;
Uno traiciona al otro y se beneficia generosamente si, al mismo tiempo, el otro jugador está tratando de cooperar (ese jugador no gana nada);
Ambos jugadores reciben beneficios mínimos si se traicionan simultáneamente.

El dilema del prisionero siempre tiene dos jugadores. Ambos tienen dos opciones distintas: cooperar o traicionar (es decir, desertar o informar contra el otro jugador). Cada jugador elige cooperar o no sin saber qué hará el otro jugador. La deserción siempre paga mejor que la cooperación. ¿El dilema? Si ambos jugadores desertan, cada uno gana menos que si ambos deciden cooperar.

Imaginando el dilema del prisionero

Para visualizar gráficamente el dilema del prisionero, piensa en una matriz simple, como una caja, con dos filas y dos columnas que dan como resultado un cuadrado cortado vertical y horizontalmente para formar cuatro cajas contiguas. Un jugador selecciona una fila horizontal, traicionando o cooperando. Las opciones están simbolizadas por letras: «R» para recompensa, «T» para la tentación de desertar, «S» para la recompensa del tonto y «P» para el castigo por la deserción mutua. El otro jugador elige una columna vertical. Juntas, estas opciones proporcionan uno de los cuatro resultados separados que se muestran en cada cuadro de la matriz:

Cuadro 1: Columna de cooperación y fila de cooperación: cuando ambos jugadores cooperan, cada uno recibe R, la recompensa por la cooperación mutua, que vale tres puntos.
Recuadro 2: Columna de deserción y fila de cooperación: cuando el jugador de la columna elige desertar y el jugador de la fila elige cooperar, el jugador de la columna desertor gana. Este jugador recibe T, por ceder a la tentación y desertar. Esto vale cinco puntos. El jugador de la fila gana S, la recompensa del tonto, que vale cero puntos.
Cuadro 3: Columna de cooperación y fila de deserción: cuando el jugador de la columna elige cooperar y el jugador de la fila elige desertar, el ganador es el jugador que desertó. Este jugador recibe una T, que vale cinco puntos. El jugador de la columna gana S, por valor de cero puntos.
Cuadro 4: Columna de deserción y fila de deserción: si ambos jugadores desertan, cada uno recibe P, el castigo por la deserción mutua. Esto vale un punto cada uno.

«Es la propia complejidad de la realidad lo que hace que el análisis de una interacción abstracta sea tan útil como ayuda para la comprensión».

Como muestra el desglose, el juego asigna puntos según las elecciones específicas de cada prisionero. Un número determinado de puntos acompaña a cada elección, es decir, R (3), S (0), T (5) y P (1). Teniendo en cuenta estas recompensas, si eres el jugador de la fila horizontal, desertar siempre es una ventaja, sin importar la elección que creas que el otro jugador planea hacer. Por lo tanto, la deserción, no la cooperación, es su elección estratégica y sensata. Esta lógica también se aplica al otro jugador, que siempre debería elegir desertar también. Por lo tanto, siempre es lógico que tanto usted como su oponente deserten. Sin embargo, en tal escenario (Cuadro 4), usted y su oponente reciben solo un punto cada uno. Esta es una recompensa menor que si ambos cooperaran, lo que gana tres puntos cada uno (Cuadro 1). ¡Qué acertijo! Las elecciones racionales conducen a beneficios individuales más pobres. De ahí el dilema.

«En condiciones adecuadas, la cooperación basada en la reciprocidad resulta estable en el mundo biológico».

No hay forma de evitar esta solución. Si tú y tu oponente os turnais para desertar, el resultado siempre será peor que si prevalece la cooperación mutua. La recompensa de tres puntos por la cooperación mutua es mayor que el promedio (dos puntos y medio) que obtiene cada jugador si uno gana cinco puntos por desertar y el otro gana cero puntos por ser un tonto. Cuando el Dilema del Prisionero se juega solo una vez, ambos jugadores eligen lógicamente la deserción y ganan un punto cada uno, una recompensa menos exitosa que si ambos hubieran cooperado. Si dos personas juegan el juego un número finito de veces, la deserción sigue siendo una elección lógica y racional para ambos. Cada jugador asume la deserción por parte del otro jugador según el último movimiento y, por extensión, el penúltimo movimiento. Por tanto, la cooperación no tiene sentido. En tal escenario,

El surgimiento de la cooperación

Esta lógica cambia si el juego se juega repetida e indefinidamente. En ese caso, puede surgir una estrategia cooperativa si los jugadores individuales no están seguros de cuándo el juego (es decir, la interacción) llegará a su último movimiento. Con eso desconocido, la cooperación puede tener más sentido que la deserción. Este escenario indefinido es más realista y realista que uno en el que dos individuos (o grupos, empresas o naciones) planifican con precisión un número finito de interacciones. En un escenario indefinido, la cooperación se vuelve posible porque ambos jugadores comprenden que pueden estar interactuando entre sí una y otra vez. Las decisiones que toman los jugadores individuales ahora pueden influir en las elecciones posteriores. Por tanto, el futuro afecta al presente. Pero como en la vida, las recompensas presentes son siempre más atractivas que las futuras. Por lo tanto,

«Tal para cual»

Teniendo en cuenta todo esto, ¿cuál es la mejor estrategia para un jugador individual en un Dilema del prisionero repetido de duración indefinida? Para averiguarlo, los investigadores organizaron un torneo. Invitaron a psicólogos, economistas, politólogos, matemáticos y sociólogos a presentar programas informáticos que compitieran entre sí. Recibieron 14 entradas.

«En situaciones en las que cada individuo tiene un incentivo para ser egoísta, ¿cómo se puede desarrollar la cooperación?»

El programa ganador, que también fue el más simple presentado, fue «Tit for Tat», presentado por Anatol Rapoport, profesor de la Universidad de Toronto. El primer movimiento de Tit for Tat es la cooperación. Después de eso, siempre imita los movimientos anteriores del otro jugador. En un juego de 200 movimientos, Tit for Tat promedió 504 puntos por juego. Otros programas que obtuvieron buenos resultados en el torneo compartieron una característica común con Tit for Tat: todos fueron agradables. Nunca desertaron en el primer movimiento. Tiene sentido que los buenos programas funcionen bien. El torneo contó con un número suficientemente grande de ellos para demostrar que trabajaron bien entre ellos, elevando así sus puntajes promedio. Tit for Tat incorpora un alto grado de lo que se puede llamar «perdón». Si el otro jugador deserta y luego coopera, Tit for Tat hace lo mismo. Más, Tit for Tat es virtualmente no explotable. Si el otro jugador deserta, también lo hace Tit for Tat, sin piedad.

“No es exagerado decir que la reciprocidad es una forma de vida en el Senado”.

Un torneo subsiguiente, abierto para todas las inscripciones, Prisoner’s Dilemma atrajo 62 propuestas de seis países. Tit for Tat fue el claro ganador en la primera y segunda ronda. Su simplicidad le dio una ventaja sobre otras tácticas. En el segundo torneo, como antes, «Los buenos chicos terminaron primero». Los programas que lo hicieron mejor contra Tit for Tat capitalizaron su amabilidad. Un juego hipotético “Tit for Two Tats” habría funcionado incluso mejor que el programa Tit for Tat real. En él, la deserción ocurriría solo si el jugador contrario desertó en los dos movimientos anteriores.

«El dilema del prisionero repetido se ha convertido en la E. coli de la psicología social».

Si los investigadores proyectaran una gran cantidad de torneos Prisoner’s Dilemma, los resultados mostrarían que los buenos programas prosperarían, mientras que los otros programas (llamados los «malvados») tenderían a abandonar eventualmente. Por lo tanto, la cooperación, en efecto, evoluciona con el tiempo para convertirse en una estrategia dominante cuando ocurren interacciones repetidas. De hecho, en tales circunstancias, es lógico que Tit for Tat se convierta en una estrategia universal que todos aplicarían.

¿Qué pasa con el mundo real?

Además de la construcción artificial del Dilema del Prisionero, la eficacia de Tit for Tat se aplica en ábitos mucho más prácticos. Considera el valor de la reciprocidad (principio rector de Tit for Tat) en el Congreso de los Estados Unidos, donde “usted vota por mi proyecto de ley y yo votaré por su proyecto de ley” es una filosofía que ha estado en juego durante años. Los congresistas individuales no pueden tener éxito sin la ayuda de sus colegas. Sus facturas nunca pasarían. Con el tiempo, sus electores los considerarían ineficaces y los destituirían por votación.

«En el dilema del prisionero repetido de larga duración, el éxito del otro es prácticamente un requisito previo para que te vaya bien».

Abundan otros ejemplos de la lógica y la sensatez de la cooperación, no solo en términos de relaciones humanas, sino también en toda la naturaleza. Considera la relación de las hormigas con los árboles de acacia (también conocidos como árboles espinosos). Las acacias proporcionan alimento y domicilio a las hormigas dentro de sus infladas espinas; las hormigas protegen a las acacias de los herbívoros hambrientos y recortan las plantas competidoras. Del mismo modo, las algas y los hongos se unen en simbiosis para formar líquenes. Incluso las bacterias a veces emplean una estrategia condicional para prosperar. La cooperación, basada en la reciprocidad (Tit for Tat), evoluciona incluso entre formas de vida no pensantes.

«Vivir y dejar vivir»

La actividad en el frente occidental en Francia y Bélgica durante la Primera Guerra Mundial proporcionó un ejemplo claro del poder cooperativo de reciprocidad que todo lo consume entre los seres humanos. Los soldados enemigos que disparaban desde las trincheras libraron batallas espantosas y sangrientas entre sí durante años, a menudo para obtener solo unos pocos metros de territorio.

«Uno de los propósitos de tener reputación es permitirle lograr la disuasión por medio de una amenaza creíble».

Sin embargo, entre las batallas reales, los soldados enemigos comúnmente mostraban una notable moderación al atacarse entre sí. Los soldados alemanes caminarían, a la vista y dentro del alcance de los rifles, pero los aliados no les dispararían. Esto se aplica igualmente a las tropas aliadas. A menudo, los bombardeos en ambos lados cesarían precisamente a la hora de comer. Los francotiradores y artilleros sabían que no debían atacar determinadas zonas marcadas con banderas. A menudo, entre las batallas, los fusileros y los operadores de artillería de ambos lados disparaban intencionalmente para fallar entre sí. Y las tropas no se dispararían unas a otras cuando prevalecía el mal tiempo.

«Una nación puede actuar en parte por el interés de sus amigos, pero este respeto no significa que incluso los países amigos siempre puedan cooperar en beneficio mutuo».

Tanto las tropas alemanas como las aliadas respetaron esas reglas tácitas. De hecho, esta filosofía de “vive y deja vivir”, aunque no se formalizó de ninguna manera entre los mortíferos combatientes de las trincheras, fue sin embargo claramente evidente en todo el Frente Occidental de 500 millas. Un veterano británico se lo explicó de esta manera a un camarada que era nuevo en las trincheras: “Sr. Bosche no es un mal tipo. Me dejas solo; te dejará en paz «.

«Si no es probable que se vuelva a ver al otro jugador, desertar de inmediato es mejor que ser amable».

Lo que sucedió en esas trincheras fue nada menos que un dilema del prisionero repetido. Dado que los soldados oponentes atacaban rutinariamente las trincheras de los demás, una política de deserción mutua (siempre disparar y bombardear para matar) fue la opción sensata a corto plazo. Esto debilitaría al enemigo. Sin embargo, las tropas enemigas que se enfrentaron entre sí a través de la Tierra de Nadie lo hicieron durante períodos de tiempo prolongados. Por lo tanto, los combatientes podrían desarrollar estrategias condicionales que se ajusten a sus interacciones prolongadas. Por lo tanto, no debería sorprender que, dadas estas circunstancias, se desarrolle una política de cooperación mutua basada en la reciprocidad entre los combatientes enemigos.

«La base de la cooperación no es realmente la confianza, sino la durabilidad de la relación».

En las trincheras, la reciprocidad fue el factor de control. Si los alemanes comenzaban a bombardear a los británicos a la hora de la cena, los británicos los seguirían de inmediato bombardeando a los alemanes en la cena y también en el desayuno. Si los francotiradores británicos de repente se convierten en tiradores precisos entre batallas, también lo harían los francotiradores alemanes. Esto fue esencialmente Tit for Tat con ametralladoras.

«Para que la cooperación sea estable, el futuro debe tener una sombra lo suficientemente grande».

Durante la mayor parte de la Primera Guerra Mundial, la cooperación fue un fenómeno espontáneo, autorreplicante y en evolución a lo largo de todo el Frente Occidental. Esto demuestra que la cooperación es una estrategia inmensamente poderosa. De hecho, puede tomar forma rápidamente, sin decirlo, entre los enemigos más letales.

Foto de fauxels en Pexels