Periodismo de datos sin datos

Me encuentro en Twitter con el siguiente gráfico despropósito de CBS News:

cbsn_0

donde se hace referencia al porcentaje de estadounidenses que dice haber probado la marihuana. Evidentemente, los porcentajes no suman 100 % porque se refieren a una misma población en tres instantes temporales diferentes. Evidentemente, digo, si uno lee todo el texto y se para a digerir lo que está viendo, por lo que mostrar una gráfica pierde toda su razón de ser.

Gráficas horribles como esta constituyen, desafortunadamente, la tónica generalizada en los medios de comunicación, con mención especial para la televisión. Pero esta en concreto me ha llamado especialmente la atención porque, paradójicamente, la torpeza en la representación esconde un despropósito mucho mayor que tiene que ver con los datos (o su ausencia, más bien).

Desconozco si CBSN quería decirnos simplemente que mucha gente apoya la legalización de la marihuana, como reza el titular. Si es así, no entiendo qué tiene que ver el porcentaje de gente que la ha probado y, en todo caso, el dato de hoy en día sería más que suficiente.

Por el contrario, la elección de la pregunta y los datos históricos sugieren más bien que el número de fumetas se ha disparado peligrosamente (crecimiento de 9 puntos en 19 años y ¡8 puntos en el último año!). Pero independientemente de su intención, la representación de una serie temporal debe hacerse de la siguiente manera:

cbsn_1

Además, cuando hablamos de porcentajes, lo ideal es comprimir el eje hasta mostrar la referencia del 0 %:

cbsn_2

Desatinos aparte, se agradece que CBSN especifique el margen de error, que es del +/- 4 % (con un nivel de confianza del 95 %, asumo, por lo que podemos inferir que el número de encuestados se sitúa entre 500 y 1000 personas). Una última mejora, por tanto, pasaría por añadir dicho margen de error:

cbsn_3

Ahora tenemos una buena gráfica, pero el problema de fondo persiste: estamos haciendo periodismo de datos sin datos. ¿Qué hay entre 1997 y 2016? No lo sabemos (y no sabemos si lo saben), y por tanto no hay manera de interpretar el aparente crecimiento del último año. Podemos hacer, no obstante, el ejercicio de inventarnos unos cuantos datos, aunque sea de manera chabacana, y ver cómo podría cambiar el cuento:

cbsn_4

Simplemente he cogido la media de los datos de 1997 y hoy y he generado valores según una normal de desviación adecuada al margen de error. Como resultado, el efecto de crecimiento acelerado desaparece. En definitiva, parece claro que ha habido un incremento desde el año 1997, pero poco o nada podemos decir del incremento del último año.

4 Comentarios

Participa Suscríbete

LucianoLuciano

No sos el único. A mí las pseudográficas periodísticas me hacen hervir la sangre.

Jordi

¡Muchas gracias por este post!

Demasiadas veces se utilizan los datos y resultados gráficos para vender noticias.

Gracias por tu rigor 😉

Daniel Bernal

genial articulo verdaderamente al leer y ver el encabezado me lo trague con patatas (creo que eso dicen los españoles) gran articulo y seguire mirando por mas pseudociencias en los medios

1 Trackback

Información Bitacoras.com

Valora en Bitacoras.com: Me encuentro en Twitter con el siguiente gráfico despropósito de CBS News: donde se hace referencia al porcentaje de estadounidenses que dice haber probado la marihuana. Evidentemente, los porcentajes no suman 100 % porque …

Responde a Daniel Bernal

Tu email nunca será mostrado o compartido. No olvides rellenar los campos obligatorios.

Obligatorio
Obligatorio

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Cancelar