La idea principal del libro Shape: The Hidden Geometry of Information, Biology, Strategy, Democracy, and Everything Else de Jordan Ellenberg es que la geometría y los modelos matemáticos pueden ayudar a entender mejor el mundo físico y a resolver problemas reales. Ellenberg argumenta que la geometría es una forma de pensar y una herramienta poderosa que puede ayudar a abordar problemas complejos desde nuevas perspectivas.
El libro examina varios temas, como la geometría que gobierna la forma de las ciudades, la geometría detrás de los virus y las enfermedades, y la geometría del mundo natural. Ellenberg explica cómo los geometras y los matemáticos han aportado a la solución de problemas científicos y sociales importantes.
Qué creencias o teorías desafía el libro Shape?
Ellenberg desafía varias creencias y teorías comunes sobre la geometría y su relación con el mundo físico. Algunos de los conceptos que el libro pone en tela de juicio incluyen:
- La idea de que la geometría es solo una herramienta abstracta sin aplicación práctica en el mundo real. Ellenberg demuestra cómo la geometría puede utilizarse para resolver problemas concretos y abordar desafíos complejos.
- La idea de que la geometría es una disciplina estancada y sin innovaciones recientes. El libro describe las últimas investigaciones y descubrimientos en geometría y muestra cómo esta disciplina evoluciona constantemente.
- La idea de que la geometría no tiene nada que ver con otros campos de conocimiento. Ellenberg describe cómo la geometría se relaciona con disciplinas tan diversas como la biología, la urbanismo y la medicina, mostrando la interconexión de las ideas y conceptos.
- La idea de que la geometría es una disciplina difícil de entender y de poca relevancia para la gente común. Ellenberg escribe de manera accesible y captivating, haciendo que la geometría sea interesante e inteligible para un público general.
Principales ideas de Shape
- Dondequiera que haya una noción de distancia, hay geometría.
- La geometría nos pide comenzar con una intuición y luego modificarla con la lógica.
- El principio del paseo aleatorio nos ayuda a comprender los caminos a través del espacio.
- Las cadenas de Markov existen en todo tipo de espacios diferentes.
- Las pandemias se propagan como progresiones geométricas, con algunas arrugas añadidas.
- Los juegos tienen una geometría que, en algunos casos, nos permite predecir sus resultados.
- Las máquinas utilizan el descenso de gradientes para aprender a equivocarse menos.
- Los políticos han explotado las matemáticas para obtener beneficios políticos.
- Los mapas generados por computadora pueden ayudar a exponer la manipulación.
Dondequiera que haya una noción de distancia, hay geometría.
En griego, la palabra «geometría» significa «medir la Tierra». Cuando examinamos la geometría de algo, eso es precisamente lo que estamos haciendo, aunque no siempre literalmente.
Un pedazo de tierra, un conjunto de personas, un tiro de caballos – podemos asignar una geometría a cada uno de ellos. Todo lo que tenemos que hacer es definir nuestra métrica , es decir, el número que usamos para indicar la distancia entre dos puntos cualesquiera. Cualquiera que sea la métrica que elijamos, dará como resultado una geometría diferente.
Por ejemplo, podríamos mirar dos puntos en un mapa a través de la métrica de la “vuelo de cuervo”, en la que la distancia es la longitud de una línea recta que conecta esos puntos. O su métrica podría ser la distancia entre dos lugares en una lista alfabética de todas las ciudades de EE. UU. Según esta métrica, Los Ángeles está más cerca de Nueva York que de San Francisco.
No son sólo los lugares los que pueden tener una geometría. Las personas también pueden hacerlo, digamos los actores. Para estudiar la geometría de los actores, sólo necesitamos una métrica que mida qué tan “lejos” están.
De hecho, ya existe una métrica para esto llamada distancia coestrella. Dos actores forman un vínculo cuando aparecen juntos en una película. La distancia entre dos actores cualesquiera es el menor número de vínculos que los unen.
Entonces, por ejemplo, la distancia entre George Reeves y Keanu Reeves es 2. ¿Cómo? Bueno, George apareció en From Here to Eternity con Jack Warden, quien estaba en The Reemplazos con Keanu.
¿Qué pasa con la geometría de una baraja de cartas? Es como la geometría de las estrellas de cine, excepto que en una escala mucho mayor. Los “puntos” son todas las diferentes formas en que se puede organizar una baraja estándar de cincuenta y dos cartas, que es un número enorme de sesenta y siete dígitos escrito como 52!, o 52 factorial.
Ahora hemos definido los puntos en nuestra baraja de cartas. A continuación, necesitamos una forma de pensar en la distancia entre ellos. Ahí es donde entra en juego la barajada, específicamente una baraja rápida, en la que se corta el mazo en dos pilas de cualquier tamaño y luego se recombinan. Si puedes barajar el mazo una vez para llegar a otro orden específico, esos dos ordenamientos están vinculados. La distancia entre ellos es el número de mezclas que se necesitan para pasar de un pedido al otro.
Ciudades, actores, barajas de cartas… ¿qué más crees que tiene geometría?
La geometría nos pide comenzar con una intuición y luego modificarla con la lógica.
Si has pasado algún tiempo en Internet, es posible que te hayas topado con una discusión sobre la pregunta ¿Cuántos agujeros tiene una pajita?
Probablemente ya te estés inclinando por una respuesta que parezca intuitiva. Es obvio que una pajita tiene dos agujeros: ¡solo mírala! Pero espera, ¿dónde empieza un agujero y termina el otro? Tal vez eso signifique que una pajita tiene un solo agujero que la atraviesa por completo. ¿O no tiene agujeros, ya que es sólo un rectángulo enrollado y los rectángulos no tienen agujeros?
La geometría puede ayudarnos a encontrar una respuesta a esta pregunta que desenvuelva todas las paradojas aparentes. Para hacerlo, necesitaremos analizar nuestras intuiciones y luego jugar con ellas para encontrar la mejor entre todas las respuestas posibles.
Entonces, ¿cuántos agujeros tiene una pajita? Bueno, eso depende de qué quieres decir exactamente con la palabra agujero. No existe una respuesta verdadera, per se. Pero la geometría nos permite encontrar uno que sea mejor que los demás.
Según el área de la geometría conocida como topología, una pajita tiene un agujero. He aquí por qué: si tomas la pajita y la acortas hasta que sea una banda plana de plástico, obtienes una forma llamada anillo, una región delimitada por dos círculos. Esa forma claramente tiene un agujero; por lo tanto, una pajita tiene un agujero.
Podemos aplicar el mismo principio a un par de pantalones. Cuantos agujeros tienen esos? Acorta un montón un par de pantalones y te quedará un tanga, conocido por los geómetras como doble anillo. Presiona la tanga para que quede plana y podrás ver que tiene dos agujeros; por lo tanto, los pantalones tienen dos agujeros.
Una pregunta más complicada sería: ¿Cuántos agujeros tiene un globo inflado? La respuesta intuitiva es cero. Pero si empujas el globo, el aire sale y te deja con un disco de goma sin agujeros. Pero si simplemente le hiciste un agujero cuando lo pinchaste, ¿cómo puede tener todavía cero?
Aquí es donde necesitamos hacer algo que no parezca intuitivo para poder resolver la paradoja. Si hacer un agujero a un globo inflado hace que termine con cero agujeros, para empezar debe haber tenido uno negativo. Esto se siente raro, ¡pero ese es el punto! En matemáticas, a menudo necesitamos aceptar que las cosas pueden parecer raras y al mismo tiempo ser completamente correctas.
El principio del paseo aleatorio nos ayuda a comprender los caminos a través del espacio.
Imagina un diagrama de cinco círculos concéntricos. Un mosquito nace en el anillo más externo. ¿Cuál es la probabilidad de encontrar el cadáver del mosquito, al final de su vida, en cualquier otro lugar del diagrama?
Ésta es la pregunta que Sir Ronald Ross pretendía responder a principios del siglo XX. El estudio de Ross sobre la trayectoria de vuelo de un mosquito dio origen a una teoría geométrica que eventualmente impregnó todo tipo de campos, desde la física hasta las finanzas e incluso la poesía. Esa teoría se llama paseo aleatorio.
Para entender el paseo aleatorio, veamos un caso sencillo en el que un mosquito sólo puede viajar en línea recta.
Supongamos que un mosquito vive diez días. Cada día, elige volar un kilómetro al noreste o al suroeste. Como tiene dos opciones diferentes cada día, su número total de caminos de vida posibles es 1.024.
Para llegar a un lugar a 10 kilómetros al noreste del lugar donde nació, el mosquito tendría que elegir volar al noreste diez veces seguidas. Sólo uno de cada 1.024 mosquitos hará eso. En cambio, existen 252 caminos que llevan al mosquito a morir en el mismo lugar donde eclosionó.
Esto es el equivalente a que el mosquito elija el noreste cinco veces y el sureste cinco veces, similar al resultado que se esperaría de diez lanzamientos de moneda. El número de caras o cruces que obtienes se establece en el 50 por ciento cuanto más lanzas la moneda. De manera similar, cuantas más veces un mosquito tenga que elegir en qué dirección volar, más probable será que el insecto termine justo donde comenzó.
El mismo principio se aplica al mercado de valores. En su tesis, el matemático francés Louis Bachelier quería calcular el precio adecuado de una opción sobre acciones , una especie de contrato que da la posibilidad de comprar un bono a un precio previamente especificado en una fecha futura concreta. Una opción sólo es valiosa si el precio de mercado del bono termina excediendo el precio al que compró la opción. El objetivo de un comerciante es intentar predecir la probabilidad de que eso suceda.
Bachelier trató el precio de un bono como un paseo aleatorio por el espacio. Descubrió que, al igual que el mosquito, es más probable que un bono termine exactamente al precio al que empezó. En otras palabras, es más probable que un comerciante no gane dinero en absoluto que gane o pierda.
Las cadenas de Markov existen en todo tipo de espacios diferentes.
Sir Ronald Ross no fue el único matemático de principios del siglo XX que pasó tiempo pensando en los mosquitos. Al otro lado del mundo, un ruso llamado Andrei Markov estaba haciendo lo mismo.
Markov no estaba pensando en mosquitos cuyas decisiones eran aleatorias. En cambio, consideró un mosquito cuya decisión sobre hacia dónde volar dependía de su decisión del día anterior.
La teoría de Markov sobre esto ahora se conoce como cadena de Markov. Y entra en juego cada vez que hablamos de navegar en un espacio, ya sea uno literal, como un pantano infestado de mosquitos, o uno abstracto, como el espacio de todas las cosas que se pueden decir con el lenguaje.
Una cadena de Markov funciona así.
Considera un mosquito que sólo tiene dos lugares donde puede volar: el pantano 0 y el pantano 1. Si el mosquito puede obtener suficiente sangre para beber en cualquier pantano en el que se encuentre, prefiere quedarse allí.
Supongamos que el mosquito comienza en el pantano 0, y hay un 90 por ciento de posibilidades de que se quede y un 10 por ciento de posibilidades de que vaya al pantano 1. En el pantano 1, tal vez haya un poco menos de sangre en el menú, por lo que el mosquito tiene un 80 por ciento de probabilidad. permanecerá y el 20 por ciento probablemente regresará al Pantano 0.
Si realiza un seguimiento del progreso del mosquito a lo largo del tiempo, terminará con una secuencia de largas estancias consecutivas en cualquiera de los pantanos: cuatro pantanos 0, seguidos de nueve pantanos 1, seguidos de trece pantanos 0, y así sucesivamente. Tome el promedio de esos números y calcule efectivamente la proporción de su vida que el mosquito ha pasado en el pantano 1. Esa cifra siempre se establece en una probabilidad fija de un tercio. El mosquito no toma decisiones aleatorias e independientes. En cambio, sus decisiones sobre qué pantano habitar están altamente correlacionados con en qué pantano se encuentra hoy, porque quiere permanecer en el mismo lugar. Las decisiones, o variables, están vinculadas.
Cuanto más de cerca mires, más probabilidades tendrás de ver cadenas de Markov en todo tipo de lugares diferentes: el lenguaje, por ejemplo.
El lenguaje consta de secuencias de consonantes y vocales. Pero no todas las secuencias tienen la misma probabilidad de ocurrir. Al analizar la novela en verso de Alexander Pushkin, Eugenio Onegin , Markov descubrió que una vocal sigue a otra vocal sólo el 12,8 por ciento de las veces. Por el contrario, en la novela Los años de infancia de Bagrov, nieto de Sergey Aksakov, ¡una vocal sigue a otra vocal el 55,2 por ciento de las veces! Detrás de los dos textos hay dos cadenas de Markov tremendamente diferentes: firmas estadísticas diferentes que, en teoría, podrían usarse para distinguir una de la otra.
Las pandemias se propagan como progresiones geométricas, con algunas arrugas añadidas.
Volvamos a Sir Ronald Ross. Ross fue la persona que se propuso describir la probabilidad de que un mosquito termine a una distancia determinada del lugar donde nació.
Hemos omitido parte de la historia porque, en realidad, los objetivos de Ross iban mucho más allá. En última instancia, quería cuantificar la enfermedad en sí y, además, cuantificar la propagación de casi cualquier cosa, desde las religiones hasta el alistamiento militar. En el curso de ese esfuerzo, él, junto con una matemática llamada Hilda Hudson, determinó que las pandemias se propagan en una secuencia llamada progresión geométrica, a veces llamada crecimiento exponencial.
Es más fácil comprender qué son las progresiones geométricas comparándolas con sus primas, las progresiones aritméticas. En ellos, la diferencia entre términos ( 60, 120 y 180, por ejemplo) permanece constante. Por el contrario, en progresiones geométricas – como 1, 3, 9– la diferencia entre términos no es la misma. Esto se debe a que la velocidad de una progresión geométrica está gobernada por un número complicado llamado valor propio, que es una especie de relación.
Los valores propios hacen que las progresiones geométricas parezcan períodos de crecimiento lento seguidos de una explosión exponencial. Vimos esto durante la pandemia de COVID-19, que había causado un total de 22 muertes en los EE. UU. hasta el 9 de marzo de 2020. Una semana después, los estadounidenses morían a un ritmo de veintidós personas por día. Otra semana y la tasa se había multiplicado casi por diez.
Teniendo en cuenta esto, se podría haber esperado ver 17 millones de casos nuevos por día a principios de julio. Pero a ese ritmo, la tasa de infección habría superado rápidamente el número total de estadounidenses. ¿Lo que realmente sucedió?
Bueno, el virus empezó a quedarse sin nuevas personas a las que infectar. La progresión geométrica no cuenta la historia completa de una pandemia debido a una variable llamada R0, que describe la cantidad de nuevas infecciones causadas por una persona infectada. Cualquier R0 mayor que uno significa que la pandemia todavía se está propagando. Cuando es menos de uno, la pandemia sufre un declive exponencial y desaparece porque el virus no infecta a suficientes personas nuevas.
Todo tipo de contagios se propagan según las mismas reglas. Considere los rumores. Un rumor se difunde cuando alguien se expone a él. Una vez que esa persona lo haya “captado”, no desencadenará una nueva ronda de propagación si escucha el rumor nuevamente. Cada rumor, al igual que cada pandemia, puede tener su propio R0 que indica cuán contagiosa es realmente.
Los juegos tienen una geometría que, en algunos casos, nos permite predecir sus resultados.
¿Qué tienen en común juegos como las damas, Connect Four y el ajedrez? Bueno, geométricamente hablando, todos se consideran árboles.
Los juegos se consideran árboles cuando observan algunos parámetros. Esos son: involucran a dos jugadores que se turnan; los resultados no están determinados por el azar, eso significa que no hay lanzamientos de monedas, hilanderos ni sorteos de cartas; y cada juego termina después de un número finito de pasos.
En todos estos juegos, una de estas tres cosas es cierta: o el primer jugador tiene una estrategia que garantiza que siempre gane, el segundo jugador tiene una estrategia que garantiza que siempre gane, o cada juego perfectamente jugado termina en empate.
Veamos cómo funciona esto mirando un juego sencillo llamado Nim.
En Nim, dos jugadores se sientan frente a montones de piedras; no importa cuántas pilas o piedras haya. Luego, los jugadores se turnan para quitar piedras. Un jugador puede quitar tantas piedras como quiera, pero sólo de una pila por turno. El jugador que coge la última piedra es el ganador.
Imagina un juego de Nim con dos montones de dos piedras cada uno. El primer jugador (lo llamaremos Akbar) comienza. Una de sus opciones es quedarse con un montón entero. Pero entonces el segundo jugador, Jeff, tomará la otra pila y ganará. ¿Qué pasa si Akbar tira una piedra? Desafortunadamente, Jeff aún lo derrota, porque puede tomar una piedra de la otra pila, dejando una piedra más para Akbar – y la última piedra para él.
La triste verdad es que toda esta configuración de Nim es una pérdida para Akbar. Podemos probar esto con seguridad dibujando un diagrama de árbol para el juego. La posición inicial del juego forma la raíz , y las posibles posiciones que se derivan de ella se denominan ramas.
Comenzando por los extremos de todas las ramas, podemos etiquetar cada posición como W para ganar, L para perder o D para empatar en juegos que permiten empates. A partir de ahí, podemos ver que ninguna de las elecciones de Akbar lo lleva a una W – haciendo que la raíz del juego sea una L.
Cada juego que forma un árbol se puede marcar de manera similar. Y en caso de que tengas curiosidad, la raíz de las damas es el empate.
Las máquinas utilizan el descenso de gradientes para aprender a equivocarse menos.
Imagínese como un alpinista que intenta alcanzar una cumbre alta. Perdiste tu mapa en algún momento del camino. Ahora ¿cómo se llega a la cima?
Una forma podría ser mirar tus pies y evaluar la pendiente. Cuando das un paso hacia el norte, ves que la pendiente sube un poco. A medida que avanzas hacia el sur, la pendiente baja. Luego, intentas girar hacia el noreste y de repente la pendiente sube mucho. Habiendo identificado la dirección con la pendiente ascendente más pronunciada, caminas unos pasos hacia el noreste y luego repites el proceso una y otra vez hasta llegar a la cima.
Este método se llama descenso de gradiente y en realidad describe cómo funciona el aprendizaje automático.
Entonces, ¿cómo funciona el descenso de gradientes en el aprendizaje automático?
Bueno, supongamos que estás intentando enseñarle a una computadora qué es un gato. Para hacer eso, le alimentas con mil imágenes diferentes de gatos, todas etiquetadas como «gato», junto con algunas imágenes etiquetadas de personas que no son gatos.
El objetivo de la máquina es desarrollar una estrategia que le permita acertar con la mayor frecuencia posible. Para una computadora, una estrategia es una forma de tomar una lista de números que representan la cuadrícula de píxeles en una pantalla y responder escupiendo un 1 o un 0 – que, en lenguaje informático, significa “gato” o “no-gato”.
La estrategia de la computadora podría ser generar el promedio de todos los números, lo que daría un 1 para una imagen completamente blanca y un 0 para una imagen completamente negra. Esa estrategia solo mide el brillo promedio general de la imagen, lo que obviamente no es bueno para identificar gatos. Es sólo una estrategia en el enorme “espacio estratégico” de diferentes posibilidades.
Pero ¿cómo medimos el éxito de una estrategia en particular? A través de una “puntuación de error” entre cero y uno. Si la computadora ve la imagen de un gato y la estrategia escupe el número uno, eso no tiene ningún error, lo que significa que su respuesta fue correcta.
Muestre a la computadora las dos mil imágenes que ya ha visto, sume todas las puntuaciones de error y obtendrá el error total. La computadora utiliza el descenso de gradiente para seguir ajustando su estrategia hasta llegar a la que tiene el menor error total.
Los políticos han explotado las matemáticas para obtener beneficios políticos.
En noviembre de 2018, los demócratas del estado estadounidense de Wisconsin estaban de celebración. Su candidato a gobernador había vencido al titular republicano, habían asumido los cargos de fiscal general y tesorero del estado, y un senador demócrata había ganado la reelección.
Pero no fue una victoria en todos los ámbitos. Habían obtenido sólo un escaño en la Asamblea del Estado de Wisconsin – la cámara baja de la legislatura estatal–, lo que permitió a los republicanos mantener su mayoría de 63 a 36. Mientras tanto, los republicanos obtuvieron un escaño en el Senado estatal.
¿Qué pasó? ¿Cómo pudieron los republicanos obtener tan buenos resultados en los distritos de la asamblea cuando Wisconsin en su conjunto votó por los demócratas? La respuesta, como ya habrás adivinado, son las matemáticas.
Hay una sencilla razón por la que los distritos legislativos de Wisconsin eran abrumadoramente republicanos: porque los republicanos los diseñaron de esa manera.
En 2011, los republicanos controlaban ambas cámaras de la legislatura de Wisconsin y la gobernación. Básicamente, se garantizaba que cualquier mapa que crearan se convertiría en ley. No importaba cuán escandalosamente se manipulara, es decir, hasta qué punto el mapa estaba diseñado para beneficiarlos políticamente. Así que lo hicieron.
Utilizando software informático avanzado, los republicanos crearon un mapa de distritos ventajoso que les permitió reducir en gran medida la cantidad de votos que su partido desperdició en cada elección. Aquí, un “voto desperdiciado” es un voto emitido en un distrito donde su partido pierde, o un voto que lleva a su partido por encima del 50 por ciento en un distrito que su partido gana.
En otras palabras, su objetivo es crear muchos distritos donde su partido apenas logra una victoria y pierde por un amplio margen en el resto de los distritos. Esto te dará la victoria en el mayor número posible de distritos.
Obviamente, no hay nada justo en la manipulación. Pero ¿cómo se puede demostrar que un mapa ha sido manipulado? Una forma posible es calcular la brecha de eficiencia en una elección determinada. Para ello, tome la diferencia entre los votos desperdiciados por cualquiera de los partidos y exprésela como porcentaje del total de votos emitidos. Una gran brecha de eficiencia – según algunos abogados, cualquier valor superior al 7 por ciento– puede ser una señal de posible manipulación.
Sin embargo, la brecha de eficiencia no es una medida perfecta y puede haber una manera mejor (usando la geometría) de demostrar que se ha producido manipulación.
Los mapas generados por computadora pueden ayudar a exponer la manipulación.
¿Cómo se ve un mapa de distrito manipulado? A veces, es bastante obvio.
Tomemos, por ejemplo, el Séptimo Distrito de Pensilvania, que parecía una representación destrozada del personaje de dibujos animados Goofy pateando al Pato Donald. El distrito estaba tan obviamente atraído por capturar votantes específicos de regiones específicas que los tribunales lo desestimaron en 2018.
¿Significa esto que la solución al gerrymandering es simplemente exigir que los límites de los distritos se dibujen con formas regulares y bonitas? Desafortunadamente, no, ya que el software de mapeo moderno le permite crear distritos que pueden verse bonitos y, al mismo tiempo, estar políticamente sesgados. En lugar de ello, podemos utilizar la geometría para determinar la probabilidad de que un mapa haya sido manipulado.
Las computadoras actuales pueden generar automáticamente una gran cantidad de mapas de distritación. Además, están programados sin prejuicios políticos y pueden producir mapas que sean legalmente permitidos, preserven la contigüidad de las regiones y no corten distritos a lo largo de las líneas de condado, vecindario o ciudad.
Sin embargo, no se puede programar una computadora para que revise todos los mapas posibles y seleccione el mejor. En primer lugar, sería poco probable que los políticos aceptaran un mapa generado por computadora, porque tienen un interés creado en ser quienes lo creen. Y segundo, hacer tal cosa es imposible de todos modos, porque hay una cantidad astronómica de maneras de dividir todos los distritos.
En cambio, lo que puedes hacer es crear un conjunto, un conjunto de mapas generados aleatoriamente. Ese proceso por sí solo requiere mucha geometría abstracta de alto nivel que trae a varios de nuestros viejos amigos: cadenas de Markov, árboles y agujeros, por nombrar algunos.
En un caso de la vida real, un grupo de profesores de la Universidad de Duke creó un conjunto de 19.184 mapas de Wisconsin. Luego observaron los resultados de las elecciones a la Asamblea del Estado de Wisconsin de 2012 y asignaron cada voto republicano y demócrata a su nuevo distrito generado aleatoriamente.
Para cada mapa, contaron el número de distritos en los que los republicanos tenían mayoría. El resultado más frecuente fue una victoria republicana en cincuenta y cinco de los escaños. El resultado en el que los republicanos obtuvieron una mayoría de 60 a 39 – el resultado real de las elecciones de 2012– fue un caso atípico extremo y, por lo tanto, una prueba bastante sólida de manipulación.
Hasta ahora, el método del conjunto no ha podido detener la manipulación. Pero cuanto más hablemos de gerrymandering, más gente aprenderá sobre ello – y más probabilidades habrá de que le pongamos fin.
Foto de John Lee