Correlación no implica causalidad

Por Colaborador Invitado, el 1 agosto, 2012. Categoría(s): Divulgación • Escepticismo

Tomemos un típico titular sobre un estudio científico tipo «Un estudio afirma que las personas que fuman ligan más». Leemos la noticia con más profundidad y vemos que un grupo de experimentadores ha comparado el grupo 1 «fumadores»con el grupo 2 «no fumadores» y ha constatado que el grupo 1 tenía un historial de  experiencias sexuales mayor que el grupo 2. Hasta aquí todo normal.

El problema es la conclusión que el lector puede extraer, o incluso el periodista o los mismos científicos. La conclusión que parece desprenderse es «fumar causa más ligues». Y aquí está el problema. Esa es, contrariamente a la intuición, una conclusión muy precipitada. Y es que una correlación entre A y B no implica que A cause B. Correlación no implica causalidad, o dicho de manera algo más pedante «Cum hoc ergo propter hoc» Vamos a explicar esa afirmación con más detalle.

Hecho: Constatamos que a más A, más B; y que a menos A, menos B. Es decir, una correlación entre A y B.

  • Posibilidad 1: A causa B. Es la conclusión precipitada. En nuestro ejemplo, fumar causa más ligues.
  • Posiblilidad 2: B causa A. Primera sorpresa, llamada «falacia de dirección incorrecta»: la causalidad era inversa a lo que pensábamos. En nuestro ejemplo, muchos ligues causan fumar, en lugar de que fumar cause más ligues. Por ejemplo, hipoteticemos que las personas que ligan mucho se estresan más y por tanto fuman más para lidiar con ese estrés.

Otro ejemplo: en la edad media, se pensaba que los piojos daban buena salud porque no se veían en gente enferma. En realidad era al revés, la buena salud hacía probable que tuvieras piojos, porque los piojos picaban a  casi todo el mundo menos a los enfermos.

  • Posibilidad 3: A causa C que causa B. Una variable intermedia que no habíamos tenido en cuenta a la hora de analizar los datos. En nuestro ejemplo, pongamos que la gente que fuma tiende a salir más a la calle ( por ejemplo en el trabajo haciendo la pausa del pitillo), y eso hace que la gente ligue más. La realidad no consistía en que fumar causara más ligues, sino en que fumar causa más salidas a la calle (variable C) y eso causa más ligues.

Otro ejemplo: se observa que los integrantes de una secta determinada tienen menos probabilidad de caer en las drogas. Se concluye que esa secta causa mayor protección ante la drogadicción. Pero observando mejor la realidad, descubrimos que los miembros de esa secta están bajo la vigilancia regular de un supervisor. La realidad no era que la secta (A) causara poca probabilidad de caer en la drogadicción (B), sino que la secta (A) causa vigilancia regular (C) que causa poca probabilidad de caer en la drogadicción (B). Así que en nuestro ejemplo podemos liberar a nuestro hijo de los exigentes preceptos de la secta y dejarlo en manos de un simple supervisor.

  • Posibilidad 4: C causa A y B. Se suele referir a este fenómeno como «relación espúria». Esta vez, la variable tercera causa los dos fenómenos. En nuestro ejemplo, hipoteticemos que las personas que son más despreocupadas (variable C) fuman más, pongamos que porque no están tan asustadas por las enfermedades pulmonares. Y ligan más, pongamos que porque no están tan preocupadas por el rechazo.

Otro ejemplo: se observa que a más consumo de helados, mayor número de ahogamientos. La conclusión «Comer helados (A) causa mayor probabilidad de ahogarse (B)» parece mucho menos ajustada a la realidad que «El calor (C) causa más consumo de helados (A) y más baños refrescantes, lo que aumenta la posibilidad de ahogarse (B). Este que acabo de contar es el ejemplo que se usa siempre, pero podríamos poner cientos de ejemplos reales, debido a que es un error muy típico.

Por ejemplo, un famoso estudio afirmaba que los niños con los pies grandes eran mejores en matemáticas. En realidad, los niños de mayor edad tenían los pies más grandes y también eran mejores en matemáticas. La edad (creo recordar que habían tenido en cuenta la edad por años, pero no por meses) era esa fastidiosa variable C. Otro estudio afirmaba que los niños que duermen con la luz encendida tenían más posibilidad de padecer miopía. En realidad, eran los padres miopes (C) los que provocaban por herencia que sus hijos tuvieran mayor probabilidad de ser miopes y los que, al parecer, tenían más tendencia a dejar la luz encendida del dormitorio de sus hijos (no he encontrado la explicación a esto último).

Finalmente, podemos incluir posibilidades mucho más rebuscadas como A causa C que causa D que causa B, tanto A causa B como B causa A, B causa C que causa A, etc.

Así que la próxima vez que leáis «Un estudio afirma que las personas que fuman ligan más«, no corráis a compraros un paquete de Ducados. Porque correlación no implica causalidad. Incluso podríamos describir un escenario en que comprarlo hiciera que ligáseis menos. Por ejemplo: imaginemos que el 85% de la población de nuestro escenario es fea, y fumar hace que se ligue más porque el humo tapa la cara y se logra eliminar esa primera impresión desfavorable. (Un ejemplo de variable C intermedia.) Pero nuestro lector de titulares de nuestro escenario hipotético casualmente no es nada feo, y cuando compre su paquete de Ducados y se ponga a fumar ocultará su atractivo rostro, lo que le proporcionará muchos menos ligues.

————————————–
Este artículo participa en los Premios Nikola Tesla de divulgación científica y nos lo envía «Antonio S.» Licenciado en Psicología.