Riesgo y recompensa en la era de la IA: ‘The Mind’s Mirror’ de Mone y Rus

En un mundo cada vez más impulsado por la Inteligencia Artificial (IA), es crucial reflexionar sobre las implicaciones de esta tecnología transformadora. El libro The Mind’s Mirror: Risk and Reward in the Age of AI de Daniela Rus y Gregory Mone nos invita a explorar tanto el potencial como los desafíos que presenta la IA en nuestra sociedad.

A través de una perspectiva experta y accesible, los autores nos sumergen en el fascinante universo de la IA, desde sus aplicaciones prácticas hasta sus fundamentos teóricos. Rus, una pionera en el campo de la robótica y directora del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT, junto con Mone, un galardonado escritor científico, nos brindan una visión equilibrada y reveladora sobre cómo la IA está transformando nuestro mundo.

En este post, nos adentraremos en algunos de los temas clave abordados en «The Mind’s Mirror», explorando cómo la IA puede potenciar nuestra productividad, generar nuevos conocimientos y revolucionar diversos campos, desde la medicina hasta la exploración espacial. Al mismo tiempo, examinaremos los riesgos y desafíos asociados con esta tecnología, y reflexionaremos sobre cómo podemos aprovechar su potencial mientras mitigamos sus posibles consecuencias negativas.

The Mind’s Mirror: Daniela Rus and Gregory Mone on the risk and reward of AI

La IA: Un catalizador de productividad y descubrimiento

Concibe la idea de contar con un asistente virtual dotado de una velocidad prodigiosa, capaz de impulsar tu eficiencia en una amplia gama de tareas. Este es el potencial de la Inteligencia Artificial como acelerador. Pensemos en la escritura, por ejemplo. Un estudio realizado con alrededor de 400 profesionales con formación universitaria reveló que aquellos que utilizaron ChatGPT para asistir en labores de redacción completaron sus asignaciones en la mitad del tiempo. Curiosamente, los escritores menos experimentados notaron mejoras en la calidad, mientras que los escritores hábiles mantuvieron sus altos estándares, pero finalizaron más rápidamente.

La IA en el Sector Sanitario

En el ámbito sanitario, la IA está abordando uno de los desafíos más acuciantes del sector: la sobrecarga administrativa. Al automatizar tareas como la codificación médica, las herramientas de IA están liberando un tiempo valioso para la atención al paciente. Sin embargo, quizás uno de los avances más apasionantes de la IA se encuentra en el descubrimiento de fármacos. En un experimento, investigadores de la Universidad de Toronto combinaron varios sistemas de IA, como AlphaFold, que predice la estructura de las proteínas, para identificar posibles compuestos para el tratamiento del cáncer. Con este enfoque, lograron identificar un compuesto candidato prometedor en tan solo 30 días, un proceso que normalmente requiere años.

La IA como generadora de conocimiento

La IA puede emplearse para generar conocimientos al revelar patrones imperceptibles para el ojo humano. Tiene la capacidad de analizar vastos conjuntos de datos, detectando patrones sutiles que podrían pasar desapercibidos incluso para los observadores más perspicaces. Los modelos de IA piensan de manera diferente a nosotros, pudiendo establecer conexiones que los investigadores humanos podrían pasar por alto. Tomemos como ejemplo el físico de IA desarrollado por Max Tegmark, del MIT. Este detective digital estudia universos simulados y extrae las leyes fundamentales que rigen estos mundos imaginarios. Es como contar con un equipo de mini-científicos incansables, cada uno proponiendo y probando teorías. La herramienta de Tegmark ha logrado descubrir nuevas reglas en estos entornos simulados, demostrando su potencial para comprender sistemas complejos en el mundo real.

Hallazgos médicos impulsados por la IA

En el campo de la medicina, la IA destaca por su capacidad para descubrir conocimientos. Emmanuel Mignot, científico del sueño de la Universidad de Stanford, ha demostrado que los modelos de IA pueden interpretar datos complejos del sueño, conocidos como polisomnografía, con la misma destreza que los expertos humanos. Además, los han utilizado para descubrir conexiones inesperadas entre los patrones de sueño y diversas enfermedades, encontrando, por ejemplo, comportamientos específicos del sueño que se correlacionan con la enfermedad de Parkinson. En otro trabajo sobre el Parkinson, Dina Khatabi, profesora del MIT, desarrolló un sistema llamado Emerald, que utiliza la propagación de señales Wi-Fi para monitorear la respiración y el movimiento de los pacientes. En los hallazgos preliminares, el sistema alcanzó hasta un 90% de precisión en la detección de las etapas tempranas del Parkinson. Esto es especialmente significativo, ya que los métodos actuales a menudo diagnostican la enfermedad solo después de que el 50 al 80% del daño cerebral ya ha ocurrido. Nos encontramos en el umbral de una revolución en el conocimiento impulsado por la IA. Estas herramientas no pretenden reemplazar a los investigadores humanos, sino potenciar sus capacidades. Esta sinergia humano-IA augura un futuro en el que podremos desentrañar problemas complejos y expandir las fronteras del conocimiento humano a un ritmo sin precedentes.

Descifrando las redes neuronales: Un recorrido por el aprendizaje iterativo

Imagina que estás adiestrando a un cachorro para que busque y te traiga objetos. Al principio, el perrito corre en círculos, ajeno a tus indicaciones. Pero con cada lanzamiento, va aprendiendo. El palo surcando el aire, los elogios que le prodigas cuando regresa con él. Los patrones comienzan a grabarse en su mente. Pronto, tu peludo compañero anticipa tus lanzamientos, interpretando hábilmente tu lenguaje corporal, posicionándose para atrapar el objeto con destreza. Entonces, ¿cómo lo logra Fluffy? Pues bien, de la misma manera que lo haría un humano. Reconociendo patrones, generando predicciones y ajustándolas, lanzamiento tras lanzamiento. Este proceso de reconocimiento de patrones y aprendizaje gradual e iterativo se asemeja al fascinante universo de las redes neuronales.

Las redes neuronales, inspiradas en cerebros animales como el tuyo y el de Fluffy, están compuestas por neuronas simuladas digitalmente y, quizás lo más crucial, por las conexiones entre ellas. Las neuronas reciben entradas, las combinan y transmiten salidas. Las conexiones, en ocasiones conocidas como bordes en el aprendizaje automático, son análogas a las sinapsis que interconectan nuestras neuronas. Cada una posee lo que se denomina un peso, un valor numérico que representa la intensidad de la conexión. Además, las redes neuronales se estructuran en capas. Para visualizarlo, imagina un imponente edificio administrativo con múltiples plantas, donde cada nivel procesa la información de manera diferente.

La planta baja, también conocida como capa de entrada, recibe datos en bruto. A medida que la información asciende a través de las capas intermedias, experimenta transformaciones, con cada nivel extrayendo características cada vez más abstractas. Finalmente, la planta superior, la capa de salida, genera la predicción o decisión de la red. Pero no nos conformemos con analogías. Adentrémonos en algo tangible, un ejemplo clásico del aprendizaje automático: el Reconocimiento Óptico de Caracteres, o OCR.

El OCR es lo que permite a tu teléfono reconocer texto en una foto que has capturado, o copiar texto de un documento que has escaneado. ¿Cómo funciona? ¿Cómo se instruye a una máquina para que reconozca letras? ¿Cómo se convierte un caos de píxeles en texto digital nítido? Estamos a punto de descubrirlo. El proceso comienza con un conjunto de datos, en este caso miles de imágenes de letras, cada una meticulosamente etiquetada por anotadores humanos como representando la letra A, B, C, etc. Seamos precisos y digamos que cada imagen es una imagen en escala de grises de 20 píxeles por 20 píxeles de tamaño. Eso son 400 píxeles por imagen. Cada píxel está representado por un número del 1 al 100, que indica el brillo desde el negro hasta el gris y el blanco. Así que lo que tenemos, entonces, son arreglos de 400 números, que van del 1 al 100, cada uno etiquetado con la letra correcta que muestra. Ese es nuestro conjunto de datos. ¿Cómo se configura nuestra red neuronal?

Imagina una serie de columnas verticales, cada una poblada con nodos circulares que simbolizan neuronas. La columna más a la izquierda, denominada capa de entrada contiene 400 neuronas, una por cada píxel. Y la columna más a la derecha, la capa de salida alberga 26 neuronas, una por cada letra del alfabeto. Entre ellas, se encuentran algunas otras columnas de neuronas, que denominamos capas intermedias.

Explorando las entrañas de las redes neuronales

Nos encontramos ante una colección de neuronas. Una capa de entrada, varias capas intermedias y una capa de salida. Es momento de establecer las conexiones entre estas neuronas. Cada neurona en una capa se enlaza con todas las neuronas de la capa adyacente a su derecha. Estas conexiones, representadas gráficamente como líneas entre las neuronas, conforman los canales por los que la información fluye a través de la red. Y como se ha mencionado anteriormente, cada conexión posee un peso, un valor numérico que determina la intensidad o influencia de la señal que transmite. Estamos a un paso de completar el cuadro. Falta un detalle crucial.

Además de sus conexiones, cada neurona cuenta con un término de sesgo asociado. El sesgo, otro valor numérico, funciona como un umbral que rige la facilidad con la que la neurona se activa o transmite información. En esencia, cuán propensa está la neurona a dispararse. Y eso es todo. Así se constituye una red neuronal. En su totalidad, los pesos y los sesgos abarcan todos los parámetros que nuestro sistema ajustará durante el proceso de aprendizaje. Todo el conocimiento que nuestra modesta red neuronal posee, y no solo la nuestra, sino también modelos de lenguaje de gran envergadura como ChatGPT, se almacena de esta manera.

Es hora de iniciar el entrenamiento. Entrenar una red neuronal implica ajustar paulatinamente los pesos y los sesgos. Estos comienzan con valores completamente aleatorios que se van afinando y perfeccionando con cada iteración del entrenamiento, por así decirlo. El proceso se inicia con lo que se conoce como un pase hacia adelante. Una imagen se introduce en la capa de entrada, y los valores numéricos se suman y multiplican entre las neuronas adyacentes, de acuerdo con los sesgos y los pesos. De esta forma, los datos fluyen hacia adelante a través de la red, atravesando las capas intermedias hasta alcanzar la capa de salida, que genera una predicción sobre las letras que con mayor probabilidad se encuentran en la imagen.

Seguidamente, la red contrasta esta predicción con la respuesta correcta, calculando el grado de error. Aquí es donde se produce la magia. Mediante un proceso denominado retropropagación, la red recorre sus pasos en sentido inverso, identificando con precisión qué conexiones contribuyeron más al error. La retropropagación es el héroe silencioso del aprendizaje profundo. Permite a la red ajustar sus parámetros, los pesos de las conexiones y los sesgos de las neuronas, para minimizar los errores. Este proceso se repite en incontables ocasiones. Con cada iteración, la red se aproxima cada vez más a la precisión, aprendiendo de sus equivocaciones como lo hace nuestro cachorro. A medida que aprende, emergen patrones. Las diferentes capas de la red contribuyen a descomponer la complejidad en fragmentos manejables. Por ejemplo, las primeras capas intermedias detectan las formas más simples posibles, como bordes de luz y oscuridad, mientras que las capas más profundas combinan estas características para identificar formas más grandes y complejas, como las líneas y bucles que se ensamblan para formar letras.

La verdadera prueba de fuego llega cuando presentamos al sistema imágenes que no ha visto antes. Si ha sido entrenado adecuadamente, debería ser capaz de generalizar a partir de sus datos de entrenamiento y clasificar con precisión estos nuevos ejemplos. Esta capacidad de generalización es lo que confiere a las redes neuronales su extraordinario potencial. Les permite aprender y manipular patrones con niveles crecientes de abstracción y sofisticación en prácticamente cualquier ámbito, desde la escritura hasta las imágenes fotorrealistas o las voces humanas simuladas como esta.