Correlación no implica causalidad

Tomemos un típico titular sobre un estudio científico tipo “Un estudio afirma que las personas que fuman ligan más”. Leemos la noticia con más profundidad y vemos que un grupo de experimentadores ha comparado el grupo 1 “fumadores”con el grupo 2 “no fumadores” y ha constatado que el grupo 1 tenía un historial de  experiencias sexuales mayor que el grupo 2. Hasta aquí todo normal.

El problema es la conclusión que el lector puede extraer, o incluso el periodista o los mismos científicos. La conclusión que parece desprenderse es “fumar causa más ligues”. Y aquí está el problema. Esa es, contrariamente a la intuición, una conclusión muy precipitada. Y es que una correlación entre A y B no implica que A cause B. Correlación no implica causalidad, o dicho de manera algo más pedante “Cum hoc ergo propter hoc” Vamos a explicar esa afirmación con más detalle.

Hecho: Constatamos que a más A, más B; y que a menos A, menos B. Es decir, una correlación entre A y B.

  • Posibilidad 1: A causa B. Es la conclusión precipitada. En nuestro ejemplo, fumar causa más ligues.
  • Posiblilidad 2: B causa A. Primera sorpresa, llamada “falacia de dirección incorrecta”: la causalidad era inversa a lo que pensábamos. En nuestro ejemplo, muchos ligues causan fumar, en lugar de que fumar cause más ligues. Por ejemplo, hipoteticemos que las personas que ligan mucho se estresan más y por tanto fuman más para lidiar con ese estrés.

Otro ejemplo: en la edad media, se pensaba que los piojos daban buena salud porque no se veían en gente enferma. En realidad era al revés, la buena salud hacía probable que tuvieras piojos, porque los piojos picaban a  casi todo el mundo menos a los enfermos.

  • Posibilidad 3: A causa C que causa B. Una variable intermedia que no habíamos tenido en cuenta a la hora de analizar los datos. En nuestro ejemplo, pongamos que la gente que fuma tiende a salir más a la calle ( por ejemplo en el trabajo haciendo la pausa del pitillo), y eso hace que la gente ligue más. La realidad no consistía en que fumar causara más ligues, sino en que fumar causa más salidas a la calle (variable C) y eso causa más ligues.

Otro ejemplo: se observa que los integrantes de una secta determinada tienen menos probabilidad de caer en las drogas. Se concluye que esa secta causa mayor protección ante la drogadicción. Pero observando mejor la realidad, descubrimos que los miembros de esa secta están bajo la vigilancia regular de un supervisor. La realidad no era que la secta (A) causara poca probabilidad de caer en la drogadicción (B), sino que la secta (A) causa vigilancia regular (C) que causa poca probabilidad de caer en la drogadicción (B). Así que en nuestro ejemplo podemos liberar a nuestro hijo de los exigentes preceptos de la secta y dejarlo en manos de un simple supervisor.

  • Posibilidad 4: C causa A y B. Se suele referir a este fenómeno como “relación espúria”. Esta vez, la variable tercera causa los dos fenómenos. En nuestro ejemplo, hipoteticemos que las personas que son más despreocupadas (variable C) fuman más, pongamos que porque no están tan asustadas por las enfermedades pulmonares. Y ligan más, pongamos que porque no están tan preocupadas por el rechazo.

Otro ejemplo: se observa que a más consumo de helados, mayor número de ahogamientos. La conclusión “Comer helados (A) causa mayor probabilidad de ahogarse (B)” parece mucho menos ajustada a la realidad que “El calor (C) causa más consumo de helados (A) y más baños refrescantes, lo que aumenta la posibilidad de ahogarse (B). Este que acabo de contar es el ejemplo que se usa siempre, pero podríamos poner cientos de ejemplos reales, debido a que es un error muy típico.

Por ejemplo, un famoso estudio afirmaba que los niños con los pies grandes eran mejores en matemáticas. En realidad, los niños de mayor edad tenían los pies más grandes y también eran mejores en matemáticas. La edad (creo recordar que habían tenido en cuenta la edad por años, pero no por meses) era esa fastidiosa variable C. Otro estudio afirmaba que los niños que duermen con la luz encendida tenían más posibilidad de padecer miopía. En realidad, eran los padres miopes (C) los que provocaban por herencia que sus hijos tuvieran mayor probabilidad de ser miopes y los que, al parecer, tenían más tendencia a dejar la luz encendida del dormitorio de sus hijos (no he encontrado la explicación a esto último).

Finalmente, podemos incluir posibilidades mucho más rebuscadas como A causa C que causa D que causa B, tanto A causa B como B causa A, B causa C que causa A, etc.

Así que la próxima vez que leáis “Un estudio afirma que las personas que fuman ligan más“, no corráis a compraros un paquete de Ducados. Porque correlación no implica causalidad. Incluso podríamos describir un escenario en que comprarlo hiciera que ligáseis menos. Por ejemplo: imaginemos que el 85% de la población de nuestro escenario es fea, y fumar hace que se ligue más porque el humo tapa la cara y se logra eliminar esa primera impresión desfavorable. (Un ejemplo de variable C intermedia.) Pero nuestro lector de titulares de nuestro escenario hipotético casualmente no es nada feo, y cuando compre su paquete de Ducados y se ponga a fumar ocultará su atractivo rostro, lo que le proporcionará muchos menos ligues.

————————————–
Este artículo participa en los Premios Nikola Tesla de divulgación científica y nos lo envía “Antonio S.” Licenciado en Psicología.

33 Comentarios

Participa Suscríbete

unoalmesomas

Se me ocurre que lo de los padres miopes y la luz encendida, puede ser que los padres se levanten de noche sin poner las gafas, y dependiendo del grado de miopía, ir a oscuras es estar ciego y reventar a patadas lo que se te ponga delante, pero con la luz y sin gafas te apañas un poco mejor :-)

RobertoRoberto

No todos (hablo de mi). A muchos no miopes les he demostrado que tengo mayor sensibilidad nocturna que ellos. Esa es una generalización porque se da en un amplio número de casos, pero no es un hecho que cumplan el 100%. Lo correcto sería decir: “los miopes solemos ver mal con poca luz”.

TegidTegid

Si hay correlación, están estadísticamente relacionados. Otra cosa es que no sea de forma directa o, como explica el artículo, sin relación causal entre ellos.

fuentedelaeternajuventud

Bueno, sí, a eso me refería, que no tiene por qué haber relación causal entre ellos, que pese a que se empieza mencionando en la entrada, luego entre las 4 posibilidades no aparece esa opción.

TegidTegid

Yo juraria que es corresponde a la relación espúrea: ambos tienen una relacion causal con un tercer elemento (con los pasos intermedios que haga falta), pero no entre ellos.

Coquejj

A estas alturas estoy convencido de que el sencillo concepto de correlación no es para todos…
Si queréis ver ejemplos hilarantes de magnitudes correladas, visitad esta web:
http://www.correlated.org/
Podéis encontrar ejemplos como el de hoy: “En general, el 36% de la gente usa la misma contraseña para prácticamente todo. Pero entre aquellos que prefieren las chanclas a las sandalias, el 50% usa la misma contraseña para casi todo”
Yo mismo escribí algo sobre el tema hace unos meses(está en galego):
http://matematicasnarua.blogspot.com...tupido.html

Rodrigo

Gran artículo!
La próxima vez que me toque explicar Redes Bayesianas creo que te voy a pillar algun ejemplo

JosellJosell

Es como los estudios esos que dicen que sólo el 7% de los científicos importante son creyentes (queriendo demostrar que los religiosos son estúpidos), y no tienen en cuenta el hecho de que es más improbable que un científico sea mujer o negro, a que sea creyente, e ignoran el hecho de que existen otros tipos de conocimiento y actividades donde dominan otros grupos.

juasssjuasss

Pero tu de donde sacas los estudios? de una iglesia evangelica o que?

AmazingaoAmazingao

Imagino que casi nadie querrá demostrar con eso que “los religiosos son estúpidos”, sino que normalmente, a mayor conocimiento de cómo funciona la naturaleza, menor probabilidad de creer en Dios, y sobre todo que, obviamente, alguien con una mente fuertemente científica tenderá más hacia el escepticismo.

martinomartino

En realidad lo que dices no tiene relación con el “hecho” de la correlación entre ser científico y ser religioso. Lo que dices se trata de una hipótesis para interpretar un fenómeno, pero la correlación no te sugiere casualidad. Es decir, nada impide que alguien sugiera una casualidad en sentido inverso al que propones. Pero eso ya son cuestiones del investigador y teorías que considere pertinentes. Por otro lado, hay herramientas estadísticas cómo la prueba de casualidad de Granger para revisar si existe casualidad y cual es el sentido direccional de la misma.

AmazingaoAmazingao

Si alguno de los “casualidad” que has puesto es en realidad un “causalidad”, entiendo en parte tu comentario, si no, me he perdido, lo siento.

Pedro J.

El comentario de Josell es apropiado para explicar además una cosa. Correlación no implica causalidad, pero la sugiere cuando tenemos razones a priori para pensar que exista una causalidad.

Por ejemplo, la imagen que utiliza el autor del post ha sido ampliamente utilizada por los “escépticos” del cambio climático antropogénico. Pero quizás (sólo quizás) no sea una correlación espuria. El calentamiento se debe a mayores emisiones de CO2 consecuencias del desarrollo económico. El desarrollo económico quizás ha creado menos incentivos para ejercer la piratería.

Josell duda que de la correlación entre “saber más de ciencia” y ser “menos creyente”. Bien. Si conoces mejor el funcionamiento del mundo, quizás eso provoque tu escepticismo ante todo tipo de creencias, incluídas las religiosas. De hecho, si como biólogo uno entiende la evolución del homo sapiens entiende que han existido otras especies y que la nuestra predomine es producto del azar. Hay un mecanismo que explica por qué estamos aquí y por qué es simple casualidad (vamos, que ningún ser superior pinta nada en esa historia). Uno apostaría que los biólogos son muy poco creyentes y de hecho según las encuestas son la disciplina con mayor proporción de ateos.

Ser creyente no te hace estúpido necesariamente, pero ser biólogo te hace muy probablemente ateo.

Milú el BárbaroMilú el Bárbaro

A parte, anda que no habrá científicos estúpidos… no creo que por ser científico tengas que ser menos imbécil necesariamente.

De todas formas, por poner un ejemplo, se me ocurre ahora una chica que es bióloga y creyente… y también polaca. Es decir, creo que la cultura y la nacionalidad influye mucho más en el hecho de ser ateo o ser creyente. De hecho, entre la gente joven, al menos yo, conozco a muuuuchos más ateos que creyentes (españoles).

AmazingaoAmazingao

Efectivamente. A eso me refería con la primera posibilidad que comento. Pero considero la segunda igualmente importante: alguien que entiende el método científico y lo aplica con regularidad, creo que tendrá una mayor tendencia a “filtrar” datos, creencias, experiencias, etc, utilizando un criterio similar. Y por tanto es probable que tenga una actitud más escéptica en general, lo cual suele llevar al ateísmo o el agnosticismo.

Es decir, creo que en este caso tendríamos que A (ser científico) provoca C (tener menor necesidad de creer en un Dios que explique el universo) y D (tener una actitud más escéptica), que a su vez provocan B (no creer en Dios). O sea, no habría causalidad directa sino que la correlación se debería a variables intermedias.

Como comenta Milú el Bárbaro, también creo que la cultura de origen afecta muchísimo, así como otros muchos factores.

Manuel CruzManuel Cruz

Yo no acabo de ver el ejemplo de la secta. El Silogismo hipotético dice que:

Si P implica Q, y Q implica R, se tiene que P implica R.

Luego pertenecer a una secta con vigilancia SI que es una causa válida de que el usuario se drogue menos.

La confusión del redactor del artículo es que para un mismo suceso puede haber varias causas válidas, y algunas causas pueden ser de uso más general, o pueden ser más interesantes/eficientes si se busca obtener el efecto.

Otro caso sería si no se cumple el paso “P implica Q” para todo P. Pero eso no invalida la deducción lógica, simplemente revela que la premisa es falsa.

Manuel CruzManuel Cruz

Abraxas, me parece que usted es incapaz de diferenciar entre lo que dice un texto, y lo que usted quiere que diga. Así me resulta muy difícil mantener una conversación inteligente.

AbraxasAbraxas

Eres tú el que se ha ido por la lógica formal. El problema de la causalidad y la correlación no es un problema de lógica, es estadístico. No puedes sustituir la expresión “provoca” por una implicación lógica, y menos a placer. Tú has modelado de una manera el problema en la lógica y yo lo he modelado de otra, más acorde a la realidad. Tú problemas que has transformado “la gente de la secta X se somete a una mayor supervisión Y” por X=>Y, y a la vez has transformado “una mayor supervisión Y provoca un menor consumo de drogas Z” como como Y=>Z. Tu problema, simplemente, está mal modelado.

Lo que tienes son dos funciones que crecen y decrecen a la vez, que significa correlación, y tú infieres que una crece/decrece a causa del crecimiento/decrecimiento de la otra. Es decir, transformas por arte de magia la correlación en causalidad.

La causalidad implica correlación, pero la correlación NO implica causalidad. La falacia lógica sería, en todo caso, de afirmación del consecuente:

P(x,y) = x causa y
Q(x,y) = y está correlacionado con x

P(x,y) => Q(x,y) pero se afirma que Q(x,y) => P(x,y)

Héctor Ibarra VidalHéctor Ibarra Vidal

La correlación NO implica causalidad, pero ¿”La causalidad implica correlación”? Si “correlación” es un término estadístico, entonces conceptualmente no puede implicar causalidad. Yo entiendo que son universos conceptuales distintos (modelos explicativos de la realidad), y el detalle es comprender que la causalidad no implica que todas las relaciones causa-efecto sean “causales”… el que yo escriba esto no es “causal”.

0 (0 Votos)
joselitojoselito

Algo se me escapa o estoy muy espeso o no sé, pero el ejemplo de los fumadores no veo que tiene que ver con una correlación. Compara dos grupos, así que es un análisis comparativo tipo t-student o ANOVA. Si quisiese hacer una correlación debería decir que ligar está relacionado con el numero de cigarros que consume.
No es el unico ejemplo en realidad hablas constantemente de grupos (tienen piojos, no tienen piojos, no hablas del numero de piojos)
Entiendo lo que quieres explicar, pero sinceramente creo que no lo estás explicando bien, porque una correlación supone dos variables (continuas o discretas) pero en cualquier caso necesitas más de dos grupos, no sirve fuman vs no fuma.
Tal vez esté equivocado y se me esté escapando algo, pero yo no veo una explicación clara del concepto de correlación

TegidTegid

¿Fuma vs no fuma no es una variable discreta… binaria? No se, digo yo…

joselitojoselito

Cierto. Al punto al que quiero llegar, es que para explicar que una correlación no indica causalidad, la forma menos intuitiva es explicándolo con variables binarias. Me parece más sencillo decir que si una variable crece la otra también (si es positiva) pero sin necesidad que una sea causa de otra.

pabupoppabupop

Correlación no implica causalidad. También salió en un programa de redes: el decálogo para ser feliz. Interesante. El mismo tema abordado desde puntos de vista totalmente disitintos.

daviddavid

Con la luz la pupila se contrae, produciendo el Efecto estenopeico, mejorando la agudeza visual si tienes algún error refractivo.

NataliaNatalia

Yo lo veo sencillo de entender: la gente que fuma más suele ser gente que sale más y hace más vida social, por lo que sus posibilidades de “cazar” son mayores que los que se quedan en casa viendo un DVD.

Por otro lado, los fumadores (lo digo por propia experiencia) sentimos una sensación de seguridad y confianza cuando fumamos, lo que también ayuda al tema ligar. Fumar es un apoyo psicológico, la pena es que mata, y eso tiene mala solución…

LabLab

Yo entiendo que cuando se desconocen las relaciones puede haber correlación y no causación. Por ejemplo, por qué para el ejemplo los que más ligan son del lado de lo que podría ser simbólicamente un falo, les afecta la nicotina y también hay una asociación inconsciente con madurez y prohibición. El problema es un problema matemático, no humano.

Héctor Ibarra VidalHéctor Ibarra Vidal

El problema de fondo es que corresponde a dos sistemas de pensamiento científico distintos; la causación o causalidad supone una relación causa-efecto necesaria entre dos variables (se cumplirá siempre) (determinismo), es decir, no es una relación estadística; mientras que una correlación es una relación estadística. Se asume que la realidad es una mezcla de todo… entre el determinismo, azar, probabilidades, complejidad…

21 Trackbacks

Información Bitacoras.com…

Valora en Bitacoras.com: Tomemos un típico titular sobre un estudio científico tipo “Un estudio afirma que las personas que fuman ligan más”. Leemos la noticia con más profundidad y vemos que un grupo de experimentadores ha comparado el grupo……

[...] libre circulación, nos estamos convirtiendo en una sociedad agotada que sigue sin comprender que correlación no implica causalidad. Que no hay Asterix ni poción mágica que nos ahorre el proceso de fallo sistemático para ir [...]

[...] Antes de profundizar, querría recomendar algo de literatura acerca de la causalidad y las falacias derivadas. Hay mucho material, pero de lo que he podido leer en el día de hoy, lo que más me ha gustado, por didáctico y entretenido ha sido esto y esto. [...]

[...] Sin embargo, dos autores de la época (J. Yerushalmy y H. Hilleboe) y que al parecer se tomaron muy a pecho las teorías de Keys en la OMS rebatieron en 1957 sus postulados con muy pocas contemplaciones. En el artículo titulado Fat in the diet and mortality from heart disease; a methodologic note (“Grasas en la dieta y mortalidad a causa de de la enfermedad cardiaca; una nota metodológica”) sostenían, muy en resumen, que porqué habría nadie de presentar este gráfico con tan solo 6 países si había datos más que de sobra (al menos de 22 países) para confeccionar aquel gráfico. Pero claro, con 22 países la correlación no era tan perfecta. Del mismo modo, argumentaron que la correlación entre dos variables no implica a priori que haya una relación de causa-efecto entre ellas. (¿Quieres aclarar estos conceptos? Te sugiero que eches un vistazo a esta entrada?) [...]

Deja un comentario

Tu email nunca será mostrado o compartido. No olvides rellenar los campos obligatorios.

Obligatorio
Obligatorio

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <p> <q cite=""> <strike> <strong>