Seguimos con las lecturas que nos ayudan a comprender la naturaleza humana. El juicio humano suele presentar dos tipos de errores que a veces se confuden: el sesgo y el ruido. Si bien Kahneman nos enseñó en “Pensar rápido, pensar despacio” el concepto de sesgo, aquí nos muestra la otra cara de la moneda de los errores de juicio: el ruido. Tan desconocido como omnipresente y tan ignorado como peligroso. Por eso toca hablar de ‘Ruido‘ de Daniel Kahneman, Olivier Sibony y Cass R. Sunstein.
Este libro, un poco denso y quizás no tan brillante como el anterior, es también claro, bien estructurado y fundamentado, lleno de experimentos y ejemplos concretos que ayudan a situar en la vida real los difíciles y abstractos conceptos de ruido de ocasión, ruido de nivel, ruido de patrón, etc.
Al examinar la medicina, el sistema judicial y los seguros, Kahneman y los coautores Olivier Sibony y Cass R. Sunstein exponen errores atroces y no detectados que una «auditoría de ruido» podría haber evitado. Al gestionar el ruido, afirman, se pueden resolver problemas en lugar de crear nuevos.
Principales ideas de Ruido
- El juicio busca encontrar el “valor verdadero”, que no es el mismo para todos.
- El ruido y el sesgo contribuyen a errores de juicio.
- El juicio mecánico elimina la complejidad y la aleatoriedad y, por lo tanto, es más confiable que el juicio clínico.
- El ruido del sistema, el nivel de ruido y el patrón de ruido contribuyen al error en diferentes proporciones.
- Mejore sus juicios utilizando «observadores de decisiones» para reducir el sesgo.
- Implemente métodos de «higiene de decisiones» para evitar el ruido antes de que suceda.
- En los sistemas de clasificación, el ruido se produce cuando los juicios son absolutos, no relativos.
- Es posible que no siempre valga la pena eliminar el ruido por completo.
El juicio busca encontrar el “valor verdadero”, que no es el mismo para todos.
La mente humana es un «instrumento de medida» y los juicios son las medidas. Un juicio es una conclusión, no un argumento. La computación reside en un lado del espectro y el gusto y la opinión en el otro. Entre ellos se encuentra el reino del juicio.
Hacer un buen juicio no es lo mismo que tener buen juicio en general. El juicio no influye en las decisiones sobre el gusto, que es variable y deseable. El juicio apunta al valor verdadero, que varía de persona a persona. La variabilidad no deseada del juicio humano conduce a la falibilidad humana.
«Una propiedad general del ruido es que puede reconocerlo y medirlo sin saber nada sobre el objetivo o el sesgo».
Los juicios se dividen en dos categorías en las que la inconsistencia es problemática, pero por diferentes razones:
- Juicio predictivo: los pronosticadores juzgan los resultados sobre la base de probabilidades. Cuando dos médicos o dos meteorólogos llegan a conclusiones muy diferentes utilizando los mismos datos, eso indica ruido.
- Juicio evaluativo: estos juicios se basan en valores y preferencias, y se produce ruido cuando las decisiones parecen arbitrarias, en lugar de ajustarse a criterios acordados.
Medir la precisión de los juicios predictivos después del hecho es casi imposible, especialmente si son condicionales o de largo plazo. Las disparidades en los juicios evaluativos, particularmente en los sistemas, conducen a la injusticia. La inconsistencia empaña la confianza y la credibilidad.
El ruido y el sesgo contribuyen a errores de juicio.
Para comprender la diferencia entre sesgo y ruido, imagina un objetivo y tiradores. Los tiradores sesgados, por ejemplo, fallan constantemente el blanco en un patrón reconocible. Los tiradores ruidosos, por otro lado, producen una dispersión aleatoria, que resulta más difícil de medir porque no se puede discernir si están apuntando al objetivo. El sesgo indica una desviación constante de los resultados previstos, como una báscula que agrega constantemente cinco libras a su peso. El ruido indica una desviación de un promedio, como un gerente que constantemente subestima o sobreestima cuánto tiempo tomará un proyecto.
«Lo que la gente suele afirmar esforzarse en los juicios verificables es una predicción que coincida con el resultado».
El ruido se produce cuando la información contradictoria requiere interpretación, porque es posible que dos personas no vean un problema de la misma manera, incluso si poseen el mismo conocimiento. Todo lo que pueden hacer es sopesar las posibilidades y asignar probabilidades, porque no existe una respuesta clara y correcta. Por ejemplo, un candidato para un trabajo puede tener un carácter difícil a la vez que ambicioso, inteligente y capaz. ¿Cómo predice el éxito de ese candidato como CEO? En un estudio, la precisión de las predicciones osciló entre el 10% y el 95%.
El juicio mecánico elimina la complejidad y la aleatoriedad y, por lo tanto, es más confiable que el juicio clínico.
Muchos juicios son predictivos y, por lo tanto, verificables. Enseñan mucho sobre el ruido. Comparando profesionales, máquinas y reglas simples, los profesionales cometen la mayoría de los errores. Para medir este error, una auditoría de ruido utiliza el «porcentaje concordante», que hace posible comparar juicios clínicos y mecánicos para determinar cuál es más preciso.
Por ejemplo, toma dos candidatos y mida la precisión con la que puede predecir su elegibilidad para un trabajo. Si bien el juicio mecánico tiene más restricciones y pondera los factores por igual, sus restricciones garantizan la confiabilidad. Con demasiada frecuencia, el juicio humano se basa en tantos factores intuitivos que la toma de decisiones se vuelve casi aleatoria. Puede pensar que su juicio tiene más matices que el de una máquina, pero su estado de ánimo, el momento y sus preferencias internas no pueden replicar la precisión de una predicción mecánica.
«Hay tanto ruido en el juicio que un modelo sin ruido de un juez logra predicciones más precisas que el juez real».
En los últimos tiempos, el aprendizaje automático, o IA, ha cobrado importancia a la hora de realizar predicciones sobre la base de grandes cantidades de datos. Con mayor precisión que cualquier humano, la IA es capaz de predecir eventos aleatorios. Los humanos tienen poca tolerancia al error en las máquinas, aunque lo toleran en sí mismos. Las personas que hacen juicios predictivos con demasiada frecuencia confían en sus instintos, lo que lleva a errores innecesarios.
Dondequiera que exista la predicción, también existe la ignorancia, y más de lo que piensas. Admitir la ignorancia es el primer paso para abordar la incertidumbre y una mejora con respecto a permitir que florezca el exceso de confianza y que el ruido se acumule en consecuencia.
El ruido del sistema, el nivel de ruido y el patrón de ruido contribuyen al error en diferentes proporciones.
Cuando las personas sacan conclusiones apresuradas, se apegan a ellas, ya sea sustituyendo una pregunta más simple por una difícil, «prejuzgando» y forzando una conclusión para que coincida, o formando impresiones coherentes rápidamente y negándose a cambiarlas. Estos sesgos contribuyen al ruido. El sesgo psicológico puede llevar a un sesgo estadístico, pero todos tenemos diferentes sesgos, que crean ruido en el sistema.
“Varias señales contradictorias crean la ambigüedad que define los problemas de juicio difíciles”.
Cuando te enfrentas a decisiones difíciles, complejas o ambiguas, tu mente busca cumplir con dos criterios: que tu juicio sea digno y que no existan mejores alternativas. Lo que usted cree y cree que creen los demás no siempre es coherente, por ejemplo, debido a su estado de ánimo. Estos «errores de patrón» contribuyen al ruido de patrón, que es una combinación de ruido de patrón estable y ruido de ocasión.
Tres factores contribuyen al ruido de patrón estable: ponderación de los componentes de clasificación, reacciones personales y diferencias cualitativas individuales entre juicios. Si agrega sus experiencias únicas y sus peculiaridades personales, sus juicios pueden ser aún más ruidosos, aunque pueden mostrar consistencia interna en línea con su personalidad.
El error aparece en tres categorías sucesivas:
- Error en el sesgo y el ruido del sistema.
- Ruido del sistema en ruido de nivel y ruido de patrón.
- Patrón de ruido en ruido de patrón estable y ruido de ocasión.
El ruido contribuye más al error que el sesgo. Entre los diferentes tipos de ruido, el ruido de patrón es significativamente más frecuente que el ruido de nivel, por lo general, al doble.
Mejora tus juicios utilizando «observadores de decisiones» para reducir el sesgo.
Para mejorar los juicios, realiza una auditoría de ruido haciendo que varios jueces evalúen los mismos problemas. La variabilidad en tus juicios es ruido. Si tienes un problema con el ruido del sistema, considera reemplazar las personas con reglas o algoritmos simples. Tenga en cuenta que la IA no puede reemplazar el juicio humano. Naturalmente, deseas alinear a los mejores jueces para mejorar tu tasa de error, pero los factores que hacen que alguien sea un buen juez no siempre están claros. Empieza por personas que ya tengan reputación de tener buen juicio. Tendrán confianza en sus juicios y serán capaces de explicar su razonamiento. Con muchos años de experiencia, sobresalen en la formación de narrativas coherentes.
“El sesgo conduce a errores e injusticias. El ruido también lo hace y, sin embargo, hacemos mucho menos al respecto «.
Alternativamente, busca jueces con un estilo cognitivo que presente un pensamiento cuidadoso. Estas personas interrogan la información para determinar si es precisa o confiable. Suelen ser más humildes y abiertos a las críticas y a cambiar de opinión a medida que cambian los hechos. Al trabajar en una auditoría de ruido, estas personas pueden observar el proceso de toma de decisiones y alertar al equipo sobre sesgos no identificados.
Implementa métodos de «higiene de decisiones» para evitar el ruido antes de que suceda.
El ruido es más difícil de identificar y corregir porque, a diferencia del sesgo, el ruido es más impredecible y más difícil de explicar. Para abordar el ruido, céntrate en la prevención, no en la cura. Este enfoque es la higiene de decisiones y se asemeja al lavado de manos entre los profesionales de la salud. Nunca sabrás qué errores evitó exactamente, pero habrá reducido estadísticamente su número.
“Al igual que el lavado de manos y otras formas de prevención, la higiene de las decisiones es invaluable pero ingrata”.
Algunos métodos para practicar la higiene de decisiones incluyen:
- Secuenciación de información para limitar la formación de intuiciones prematuras: el sesgo cognitivo puede afectar a muchas profesiones, como la ciencia forense. Brinde a las personas solo la información que necesitan cuando la necesiten y pídales que documenten sus juicios en cada paso.
- Agregar múltiples estimaciones independientes: la previsión sufre un sesgo infame y, estadísticamente, los pronosticadores son terribles en su trabajo. La solución más sencilla es promediar varios juicios, lo que reduce drásticamente el ruido.
- Desarrollo de pautas de diagnóstico: los médicos confían en su capacitación para diagnosticar trastornos, y algunos lo hacen mejor que otros. Tener pautas simplifica el proceso de diagnóstico y reduce los errores.
En los sistemas de clasificación, el ruido se produce cuando los juicios son absolutos, no relativos.
Todo el mundo teme las revisiones de rendimiento, que se han vuelto cada vez más complejas a lo largo de los años. Si bien son endémicas, siguen siendo inútiles para determinar el verdadero valor de un empleado. Definir la escala en las calificaciones de desempeño es un método de higiene de decisiones. Elija una única dimensión y clasifique a los empleados entre sí, en lugar de utilizar escalas absolutas. La clasificación reduce el ruido del patrón y el nivel de ruido, produciendo resultados que son más consistentes y, por lo tanto, más precisos.
«Puede mejorar los juicios aclarando la escala de calificación y capacitando a las personas para que la utilicen de manera constante».
El ruido es un problema cuando contrata gente nueva. Los entrevistadores aportan sesgos cognitivos al proceso. A menudo, se basan en las primeras impresiones y luego buscan la coherencia. ¿La solución? Estructurar juicios complejos agregando evaluaciones de diferentes jueces. Google, por ejemplo, utiliza estos principios en su estructura:
- Descomposición: divida la decisión en componentes. Eso enfoca a los jueces en la información relevante.
- Independencia: haga preguntas predefinidas sobre el comportamiento de los candidatos en diversas situaciones.
- Juicio holístico retrasado: no excluyas tu intuición sobre un candidato. Retrasarlo. Forma un comité para revisar todos los datos recopilados por los entrevistadores para tomar una decisión colegiada.
Los datos impulsan a Google. Por lo tanto, la decisión final no es mecánica, sino que se basa en promediar las puntuaciones combinadas.
Es posible que no siempre valga la pena eliminar el ruido por completo.
Los costos pueden superar los beneficios cuando se intenta eliminar el ruido. Uno de los costos más importantes es la injusticia, ya que los juicios mecánicos no pueden reemplazar el discernimiento humano, particularmente cuando la vida de las personas está en juego. Los costos financieros pueden ser demasiado para las instituciones públicas, como las entidades educativas.
A veces, la reducción de ruido provoca más errores de los que corrige. Por ejemplo, los algoritmos superan a los humanos al hacer juicios sin ruido. Sin embargo, permiten sesgos inaceptables. Los seres humanos valoran su juicio porque es más perspicaz y matizado, y se basa en fundamentos morales que nadie quiere ignorar. La misericordia, por ejemplo, es una cualidad humana que nadie quiere que un algoritmo elimine. Si los métodos de reducción de ruido son injustos o toscos, pero el ruido causa una injusticia irremediable, la solución es crear mejores métodos de reducción de ruido, no ignorar el problema.
“Puede ser costoso eliminar el ruido, pero a menudo vale la pena incurrir en ese costo.
El ruido puede ser terriblemente injusto «.
Los valores sociales evolucionan continuamente, y la flexibilidad en los juicios puede permitir que florezcan nuevos valores y creencias. En los lugares de trabajo, tener reglas mecánicas que rijan sus tareas puede parecer deshumanizante y sofocar la creatividad. La reducción de ruido es beneficiosa en los sistemas basados en reglas.
En cuanto a las normas, que están más abiertas a la interpretación y, por lo tanto, al juicio, es más deseable reducir el ruido. Los estándares son vagos por una razón: requieren más matices. Por ejemplo, una universidad puede tener una política estándar con respecto al acoso sexual, pero no reglas sobre cómo comportarse en cada situación. Sin embargo, cuando ejerza su juicio, tenga en cuenta que su objetivo es la precisión, no la autoexpresión.
Foto de Kathryn Archibald en Pexels