Sesgo de participación
A pesar de ello, la comunidad tecnológica sólo ha empezado a comprender recientemente la importancia de contar con datos completos y fiables. Hoy en día, estamos empezando a comprender cómo la calidad de los datos está vinculada a la eficacia de los sistemas de IA y cómo, por citar otra cita que se atribuye a menudo a Norvig, “Más datos supera a los algoritmos inteligentes, pero mejores datos superan a más datos”.
Precisamente por eso he estado hablando de cómo mejorar la calidad de los datos enfrentándonos a las formas en que nuestra subjetividad humana puede interferir en la forma en que recogemos, procesamos y analizamos los conjuntos de datos. Recientemente escribí sobre el sesgo de confirmación, por ejemplo, lo que me hizo pensar en otro sesgo muy común que se extiende mucho más allá de la ciencia de los datos en los ámbitos de las finanzas, las noticias, el entretenimiento y las redes sociales: el sesgo de supervivencia.
El ejemplo más clásico de sesgo de supervivencia sigue siendo uno de los más fáciles de entender: Abraham Wald y su análisis de los aviones estadounidenses durante la Segunda Guerra Mundial. Wald, un notable matemático, dirigía un grupo de estadísticos a los que se les encargó analizar los daños sufridos por los aviones que regresaban del combate. Con ello, esperaban determinar qué zonas de los aviones necesitaban más o menos blindaje para mejorar su rendimiento.
Sesgo de supervivencia de los gatos que caen
Este hipotético patrón de daños de los aviones supervivientes muestra los lugares en los que pueden sufrir daños y aún así volver a casa. Si los aviones se reforzaron en las zonas más impactadas, esto sería un resultado del sesgo de supervivencia porque se están ignorando los datos cruciales de los aviones fatalmente dañados; los impactados en otros lugares presumiblemente no sobrevivieron.
El sesgo de supervivencia es el error lógico de concentrarse en las entidades que superaron un proceso de selección y pasar por alto las que no lo hicieron. Esto puede llevar a conclusiones incorrectas debido a que los datos son incompletos.
El sesgo de supervivencia es una forma de sesgo de selección que puede llevar a creencias demasiado optimistas porque se pasan por alto múltiples fracasos, como cuando se excluyen del análisis de los resultados financieros empresas que ya no existen. También puede llevar a la falsa creencia de que los éxitos de un grupo tienen alguna propiedad especial, en lugar de una mera coincidencia como en la correlación que “prueba” la causalidad.
Otro tipo de sesgo de supervivencia implicaría pensar que un incidente no fue tan peligroso porque las únicas personas que estuvieron involucradas en el incidente que pueden hablar de él son las que sobrevivieron. Incluso si uno supiera que algunas personas están muertas, no tendrían su voz para añadir a la conversación, lo que llevaría a un sesgo en la conversación.
Sesgo de los expertos
En términos sencillos, esto se produce cuando seleccionamos sólo a los “supervivientes” -aquellos que superaron al resto, ya sean personas, máquinas o empresas- y llegamos a conclusiones basadas en sus atributos, sin examinar de forma más amplia todo el conjunto de datos, incluidos aquellos con características similares que no obtuvieron tan buenos resultados.
El ejemplo más famoso de sesgo de supervivencia se remonta a la Segunda Guerra Mundial. En aquella época, el ejército estadounidense pidió al matemático Abraham Wald que estudiara la mejor manera de proteger a los aviones de ser derribados. Los militares sabían que el blindaje ayudaría, pero no podría proteger todo el avión o sería demasiado pesado para volar bien. En un principio, su plan era examinar los aviones que volvían del combate, ver dónde habían recibido los peores impactos -las alas, alrededor del artillero de cola y en el centro de la carrocería- y luego reforzar esas zonas.
Pero Wald se dio cuenta de que habían caído en el sesgo de la supervivencia, ya que su análisis pasaba por alto una parte valiosa de la imagen: los aviones que habían sido alcanzados pero que no habían regresado. Como resultado, los militares estaban planeando blindar precisamente las partes equivocadas de los aviones. Los agujeros de bala que observaban indicaban en realidad las zonas en las que un avión podía ser alcanzado y seguir volando: exactamente las zonas que no necesitaban ser reforzadas.
Sesgo de supervivencia svenska
El sesgo de supervivencia o survivor bias es la tendencia a considerar el rendimiento de los valores o fondos existentes en el mercado como una muestra global representativa sin tener en cuenta los que han quebrado. El sesgo de supervivencia puede dar lugar a la sobreestimación del rendimiento histórico y de los atributos generales de un fondo o índice de mercado.
El sesgo de supervivencia es una singularidad natural que hace que los fondos existentes en el mercado de inversión sean más visibles y, por tanto, se consideren más como una muestra representativa. El sesgo de supervivencia se produce porque muchos fondos del mercado de inversión son cerrados por el gestor de la inversión por diversas razones, dejando a los fondos existentes a la cabeza del universo inversor.
Los fondos pueden cerrar por diversas razones. Numerosos investigadores del mercado siguen y han informado sobre los efectos de los cierres de fondos, destacando la aparición del sesgo de supervivencia. Los investigadores del mercado siguen regularmente el sesgo de supervivencia de los fondos y los cierres de fondos para calibrar las tendencias históricas y añadir nuevas dinámicas al seguimiento de los resultados de los fondos.