Confirmación del radio de movilidad como predictor de tendencia de los datos de COVID-19: El sesgo de la consolidación retrospectiva y la paradoja de Stockdale

Por Colaborador Invitado, el 24 abril, 2021. Categoría(s): Ciencia

Al inicio del mes marzo anunciamos la predicción de la fecha de llegada de la cuarta ola. Nos basamos en la observación empírica de que los casos y las muertes asociadas al COVID-19 aumentan dos y tres semanas después de que la mediana del radio de movilidad supera cierto valor crítico, situado en el 70% de su valor de pre-pandemia.

El radio de movilidad mide la dispersión de nuestros desplazamientos y captura las características más relevantes de nuestra movilidad diaria. Podemos ver los picos en el radio para las fechas especiales de 2019 como Semana Santa, las vacaciones de verano, el puente del 12 de octubre, el puente de la Constitución o Navidades, así como los valles de 2020 y 2021 durante los confinamientos y los picos que se dieron durante el relajamiento de las restricciones, anticipándose a las distintas olas de contagios que hemos sufrido.

Nuestro equipo ha hecho un trabajo extraordinario recolectando el radio de movilidad de más de 10 millones de usuarios, cada día desde el 1 de enero de 2019 hasta ayer mismo, actualizando cada 24 horas. Cada día obtenemos una distribución de valores incluyendo a los usuarios con los radios más pequeños hasta los más altos. En la figura vemos la evolución semanal de los percentiles de esa distribución junto con la media y la mediana. Felicidades a David Mateo, Jordi Bayer y Jordi Escrich por su gran trabajo.

Efectivamente, encontramos que el radio se correlaciona con el número de contactos ya que en la mayoría de los casos nos desplazamos para encontrarnos con alguien, o para hacer actividades en lugares donde hay más personas. De esta forma, una mayor dispersión en nuestra movilidad se correlaciona estadísticamente con más contactos, y tener más contactos se correlaciona estadísticamente con más contagios. Esta cadena de correlaciones convierte al radio de movilidad en un predictor temprano de la evolución de la pandemia.

Todavía es pronto para verificar nuestra predicción del 1 de marzo ya que los datos de COVID-19 aún se están consolidando, pero recientes comentarios en los medios nos empujan a actualizar la información que tenemos sobre el tema. Este es nuestro análisis de la situación actual respecto movilidad y COVID-19.

1. Confirmación de la predicción del radio de movilidad

La mediana del radio de movilidad cruzó el valor crítico la última semana de febrero, y el número de casos positivos por COVID-19 tuvo el punto de inflexión durante la segunda semana de marzo, pasando de decrecer a crecer. Las hospitalizaciones también cambiaron de tendencia tres semanas después del incremento de movilidad tal y como esperábamos (típicamente oscila entre las dos y tres semanas). A nivel regional, vemos que la comunidad de Madrid cruzó el valor crítico una semana antes, y en consecuencia todas las métricas de COVID-19 también cambian de tendencia antes que sus equivalentes nacionales. Tanto el número de casos como defunciones bajaban diariamente para la gran mayoría de provincias en el momento de nuestra predicción, pero desafortunadamente la semana pasada subieron los casos en 46 de las 50 grandes provincias, así como las hospitalizaciones, ingresos en UCI y defunciones en 20 de ellas. La situación no es buena y la movilidad sigue por encima del valor crítico sin ningún signo de bajar.

España

Existe una historia relevante detrás de estos datos: El radio de movilidad tuvo un pico durante la Semana Santa y descendió las semanas posteriores, pero sigue por encima del valor crítico. Sin embargo:

  • Las hospitalizaciones y los ingresos en UCI parecen decrecer en las últimas semanas pese a que los casos positivos siguen creciendo.
  • El número de defunciones no ha dejado de descender a nivel nacional, y el punto de inflexión en Madrid se da 5 semanas después del incremento en la movilidad.
  • El crecimiento de casos positivos crece más lento que en olas anteriores.

Un candidato a explicar estas aparentes contradicciones es la campaña de vacunación. Efectivamente esperamos un efecto positivo de la campaña. No obstante esperamos este efecto en los números absolutos pero no en las tendencias de crecimiento o decrecimiento de casos o defunciones en sí. Consideramos que en su lugar estamos ante otros dos efectos, relacionados con la naturaleza de los datos y del propio proceso de recolección: la invariancia de escala y la consolidación retrospectiva.

2. Interpretación de los datos

Invariancia de escala

Simplificando: un sistema muestra invariancia de escala cuando la forma natural de analizar los datos implica el uso de la escala logarítmica. Efectivamente, hemos aprendido con la pandemia que en un proceso multiplicativo como el de los contagios la representación adecuada es la escala logarítmica. ¿Están creciendo los casos de forma más lenta que las olas anteriores? Sí en escala lineal, no en escala logarítmica:

La expansión en una epidemia es un proceso multiplicativo y por tanto muestra invariancia de escala. Cualquier conclusión debería salir tras mirar los datos en escala logarítmica. Si hacemos eso, encontramos que la cuarta ola está arrancando exactamente al mismo ritmo que lo hizo la tercera (panel derecho, líneas segmentadas como guía). Este hecho no es obvio cuando miramos el número de casos en escala lineal (panel izquierdo).

En vista de esta figura, podemos esperar que los casos se dispararán en las próximas semanas si la tendencia continúa. (También parece que cada pico y valle es más extremo que el anterior, ¿estaremos entrando en resonancia?)

Consolidación retrospectiva

El proceso de consolidación de los datos es complejo e involucra a miles de personas. No es fácil y requiere esfuerzo y tiempo, en algunas regiones más que en otras. Todos los días obtenemos la actualización de los datos del número de casos y defunciones, pero muchos de esos casos son de días, semanas e incluso meses atrás. Es también más sencillo consolidar una tendencia cuando los números son grandes ya que esas situaciones complejas que retrasan la consolidación tienen menos peso específico en el total, pero éstos son muy relevantes cuando los números son bajos ya que toda fluctuación es grande en términos relativos. En otras palabras: es más difícil conseguir actualizaciones precisas cuando los números están bajos.

Podemos comprobar cómo la serie temporal ha cambiado con las actualizaciones: casos positivos suelen consolidarse en un par de días, pero ingresos en UCI y defunciones pueden tardar semanas o meses. Los datos de Madrid se consolidan más pronto que a nivel nacional y ya están mostrando un aumento en el número de defunciones. Esto es normal ya que a nivel nacional se va tan lento como la región más lenta.

El número de casos positivos se consolida típicamente más rápido que el número de defunciones, tal y como vemos al comparar varias actualizaciones a diferentes fechas.

En resumen, lo que sabemos es:

  • Regiones con consolidación más rápida ya están registrando aumentos en el número de hospitalizaciones, ingresos en UCI y defunciones.
  • La consolidación tarda más cuanto más bajos son los números.
  • La consolidación a nivel nacional es tan lenta como la región más lenta.

Para entender mejor dónde estamos ahora respecto a la emergencia de la cuarta ola, veamos qué sabíamos durante la emergencia de la tercera comparado con la consolidación retrospectiva de los datos (usemos escala logarítmica ya que sabemos que es más conveniente para entender la situación):

España cruzó el valor crítico del radio de movilidad en la primera semana de diciembre, teniendo el pico en la semana de Navidades. El punto de inflexión en el número de defunciones entre la segunda y tercera ola tuvo lugar alrededor del 15 de diciembre (de acuerdo a los datos que tenemos hoy). Sin embargo, con los datos que teníamos el 28 de diciembre sólo vimos una bajada constante. Sólo notamos una estabilización en el número de muertes el 15 de enero, y en sólo 5 días, con la actualiación del 20 de enero, supimos sin ninguna duda que las muertes llevaban semanas subiendo. Esto son 7 semanas de diferencia entre el aviso temprano del radio de movilidad y la consolidación de los datos.

Teniendo esto en cuenta, es probable que hoy estemos en una situación muy parecida.

3. Conclusiones 

  • ¿Está la cuarta ola creciendo más lentamente?

No, está creciendo al ritmo esperado dada la escala de los números en los que estamos, que son más bajos ahora que cuando empezó la tercera ola.

  • ¿Debemos esperar un incremento retrospectivo en el número de defunciones?

Tenemos que esperar a que consoliden los datos, pero sí, es probable un incremento retrospectivo tal y como ocurrió en la tercera ola.

Debemos tomar decisiones basadas en datos, pero debemos tener en cuenta de dónde vienen estos datos y los sesgos que pueden presentar. Si no lo hacemos, podemos sufrir el riesgo de esparcir información incorrecta. Es plausible que la campaña de vacunación esté manteniendo el número de muertes bajo. Es también plausible que el incremento de movilidad en Semana Santa no esté teniendo efecto en la cuarta ola. Sin embargo, es altamente probable que sea un efecto superfluo de la consolidación de los datos y de la escala en la que están hoy las cifras de casos y defunciones.

Santiago Simón declaró esta semana que «Ahora mismo da la sensación de que el efecto que podríamos haber esperado por el incremento de la movilidad de la Semana Santa no se está produciendo con los datos que disponemos a fecha de hoy» [1]. La clave del comentario es la coletilla de “con los datos que disponemos a fecha de hoy»: el efecto no es visible ya que esos datos no están consolidados y por tanto no se deberían sacar conclusiones de ellos.

Los datos no consolidados en el número de casos y defunciones dan siempre la impresión de que la situación es mejor de lo que realmente es. Apreciamos el esfuerzo de Fernando en tratar de dar esperanza y agradecer el esfuerzo y sacrifico que la población está haciendo, pero un mensaje de falso optimismo a una población cansada tiene el riesgo de que se infravalore el peligro de la cuarta ola, y más importante: nos quemará y frustrará sicológicamente aún más cuando nos demos cuenta de que esto no se acaba y que el problema sigue aquí.

Esto se conoce como la paradoja de Stockdale [2]: debes ser optimista a largo plazo, pero te vendrás abajo si eres ingenuamente optimista en el corto, pues acumularás una decepción tras otra.

El almirante Jim Stockdale fue prisionero de guerra en Vietnam por 8 años, y estas fueron sus palabras en su famosa entrevista con el escritor Jim Collins:

Finalmente le pregunté: “¿Quién no lo consiguió?”

“Oh, esa es fácil” dijo, “Los optimistas”

“¿Los optimistas? No entiendo.”

“Los optimistas. Ellos son los que decían: ‘Seremos libres en navidad’, llegaba la Navidad y pasaba la Navidad. Entonces decían: ‘Seremos libres en Semana Santa’, llegaba Semana Santa y pasaba Semana Santa, y entonces decían: ‘Seremos libres para el día de Acción de Gracias’, y entonces llegaba la Navidad otra vez. Y morían porque se les rompía el corazón. Esta es una lección muy importante. Nunca debes confundir la fe en que lo conseguirás al final -que nunca deberías darte el lujo de perder- con la disciplina de afrontar los hechos más brutales de tu situación actual, sea cual sea.”

Personalmente, soy un optimista por naturaleza (no te metes a un doctorado ni creas una empresa si no eres estúpidamente optimista) y sé que la situación mejorará y saldremos buenamente de ella. Pero aún no, no ahora. Debemos ser realistas sobre el presente para poder ser optimistas sobre el futuro. (Sobre todo si ese futuro es el verano y queremos irnos de vacaciones sin estar coleteando una cuarta ola que nunca acaba.)

  • ACTUALIZACIÓN con datos a 20 de abril 2021:

Este artículo nos lo envía Alberto Hernando de Castro, doctor en física por la Universidad de Barcelona, quien tras dedicarse a física cuántica y sistemas complejos por más de una década cofundó junto a Ignacio Barrios la startup de Big Data Kido Dynamics SA. Allí trabaja con David Mateo, Jordi Bayer y Jordi Escrich entre otros, quienes hacen posible la magia tecnológica de tener acceso diario a los datos de movilidad.

Notas:

[1] https://www.20minutos.es/noticia/4664409/0/tres-autonomias-mas-entran-en-riesgo-extremo-por-covid-pero-simon-es-optimista-hay-que-estar-satisfechos

[2] https://www.huffpost.com/entry/the-stockdale-paradox_b_5897ca82e4b02bbb1816bc38

 



Por Colaborador Invitado, publicado el 24 abril, 2021
Categoría(s): Ciencia