El sujeto RPCI-11 y la maldición de los asuang de Panay

Por Guillermo Peris Ripollés, el 6 enero, 2021. Categoría(s): Genética • Historia • Medicina

El 23 de marzo de 1997, el sujeto RPCI-11 se permitió remolonear un poco más en la cama; al fin y al cabo, era domingo. El día se presentaba soleado en la ciudad de Buffalo (Nueva York). A media mañana pensó en pasar por su cafetería habitual, cuyo café le gustaba especialmente y además solían servirlo con una tarta de lima casera exquisita. Se sentó en la barra, en un taburete alto con asiento acolchado, y mientras tomaba despacio su café leyó el periódico local, The Buffalo News. En una de las páginas, sus ojos se posaron en un anuncio que reclamaba voluntarios para un experimento científico. Decían pagar sólo a cambio de una muestra de sangre. No le sobraba el dinero y no parecía suponer riesgo alguno, así que pensó en llamar y ofrecerse. Tras ponerse en contacto con los anunciantes y acordar una cita, al sujeto RPCI-11 le extrajeron una muestra de sangre.

Anuncio de The Buffalo News del domingo 23 de marzo de 1997 pidiendo voluntarios para el proyecto genoma humano (fuente).

Espero que perdonéis que haya novelado ligeramente los hechos en el párrafo anterior; no podemos conocer si ese 23 de marzo de 1997 el día transcurrió así para el sujeto RPCI-11 porque lo cierto es que ni siquiera sabemos quién es, al menos no su nombre. No obstante, sí tenemos algo de información sobre él: era un hombre, de origen afroamericano y con un elevado riesgo de padecer diabetes de tipo 1. Lo más importante es que este hombre (como contaré más adelante) determinó todos los estudios del genoma humano de los últimos 20 años, permitiendo conocer las causas genéticas de multitud de patologías. Pero también dificultó la resolución de otros misterios, como el de la maldición de los asuang en la isla de Panay.

Los asuang de Panay

En la imagen se destaca la provincia de Capiz en la isla de Panay (Filipinas).

La leyenda de los asuang parece nacer en 1859 en la provincia de Capiz, situada en la isla Panay (Filipinas). En ese momento, la isla estaba bajo el dominio de España, que enviaba a religiosos para evangelizar a los nativos. Esta evangelización incluyó la erradicación de los grupos de babaylans, grupos de mujeres hechiceras que luchaban contra la colonización. Los frailes cometían auténticas tropelías contra estas mujeres, como ordenar su violación o lanzarlas a ríos llenos de cocodrilos. Un grupo de babalyans se vengó de estos actos raptando a uno de los frailes. Un pelotón de soldados enviado en su búsqueda lo encontró desmembrado, eviscerado y decapitado, y a punto de ser devorado por las hechiceras Aquí empezó la leyenda de los asuang, que con el tiempo evolucionó y pasaron a describirse como criaturas nocturnas con cuerpos distorsionados que atacaban a sus víctimas mientras dormían e incluso robaban los fetos de las mujeres embarazadas.

Dibujo de un asuang, por Cindy Lapeña (Fuente)

Al igual que otros mitos (como los vampiros, hombres lobo, etc) la leyenda de los asuang también podría tener una base médica. En 1975, un par de médicos filipinos descubrió un desorden del movimiento que presentaba características de Parkinson y otras patologías distónicas. A esta enfermedad la llamaron distonía de Parkinson ligada al cromosoma X (XDP por sus siglas en inglés). Esta es una enfermedad rara (con menos de 1 caso por 1 000 000 de habitantes) que se da básicamente en Filipinas (1 caso por cada 322 000 habitantes) pero que en la provincia de Capiz alcanza unos niveles altísimos: ¡1 caso por cada 4 000 habitantes!

La distonía de Parkinson se da en hombres y provoca movimientos incontrolados de los miembros, temblores en la lengua acompañados de una salivación excesiva que dificultan el habla y contracciones musculares involuntarias. Si a esto le sumamos que, por vergüenza, los afectados por esta enfermedad sólo salen de noche para no ser vistos, tenemos las piezas necesarias para construir un mito en la zona asociado a la leyenda de los asuang.

Imágenes de varios afectados por la distonía de Parkinson (Fuente).

El estudio genético de los afectados por este síndrome localizó el área que podría estar implicada en el desarrollo de la enfermedad: el gen TAF1, situado en el cromosoma X. Sin embargo, cuando se intentaba encontrar la mutación o cambio concreto que provocaba la enfermedad, no se localizaba.

Como veremos, el responsable de no encontrar el cambio concreto del genoma que provoca la distonía de Parkinson fue, en parte, el ciudadano RPCI-11 y su participación en la construcción del genoma humano de referencia.

El genoma humano de referencia

Bill Clinton anunciando el 26 de junio de 2000 la culminación del primer borrador del genoma humano por parte del Proyecto Genoma Humano (representado por Francis Collins, derecha) y la empresa Celera (representada por Craig Venter, izquierda). Fotografía de Ron Sachs/CNP/Corbis (fuente).

Si tenéis una cierta edad puede que recordéis la imagen que se encuentra sobre estas líneas: se trata del anuncio realizado el 26 de junio de 2000 por parte del por entonces presidente de los EE.UU., Bill Clinton, de la culminación del primer borrador del genoma humano, obtenido mediante investigación pública (el Proyecto Genoma Humano) y privada (la empresa Celera de Craig Venter). Este acto culmina un proyecto de 13 años cuyo objetivo era conocer nuestro genoma para utilizar esta información en la investigación y tratamiento de enfermedades. Gracias a este proyecto disponemos hoy en día de un genoma humano de referencia, es decir, la secuencia de 3200 millones de letras que componen nuestro ADN. El número de avances que ha propiciado este genoma de referencia es incontable. Si os interesa aprender más cosas sobre este genoma de referencia os aconsejo leer este artículo de Lluis Montoliu.

Fijaos en la primera palabra en negrita del párrafo anterior: borrador. Efectivamente, en ese momento no se llegó a construir todo el genoma de referencia humano ya que había muchos «huecos» en zonas difíciles de secuenciar (por ejemplo por su elevado número de repeticiones, lo cual dificulta la lectura). En los años siguientes se siguieron completando y rellenando huecos, pero lo cierto es que a día de hoy aún no se ha finalizado la exploración de todo el genoma humano. Para que os hagáis una idea, el único cromosoma que se ha secuenciado por completo, sin hueco alguno, ha sido el cromosoma X y la investigación se publicó en julio del pasado año 2020 (también se ha publicado una versión completa del cromosoma 8, pendiente de revisión por pares).

Habréis observado que he resaltado una segunda palabra en negrita: referencia. ¿Es este genoma realmente representativo de toda la población humana? Podríamos decir que sí, dado que todos los humanos compartimos en torno al 99.9 % del genoma. Además, es de imaginar que para este genoma de referencia se habrán tenido en cuenta las muestras de individuos de todo el mundo, de diferentes etnias, grupos poblacionales, etc, ¿no?

Pues no.

Para empezar, el genoma de referencia humano se construyó a partir de las muestras de 20 voluntarios (reclutados mediante el anuncio del periódico The Buffalo News que se muestra al inicio del artículo). Y no fue hasta 2010, en un análisis suplementario de una investigación sobre genes humanos procedentes de neandertales, cuando descubrimos que la mayor parte de esta referencia procede de un solo individuo de aquellos voluntarios: el sujeto denominado RPCI-11 (RPCI son las siglas de Roswell Park Cancer Institute, en el que se llevó a cabo la secuenciación de la muestra) es responsable de dos tercios del genoma de referencia. Aunque la identidad de este donante es completamente desconocida, sí sabemos que su genoma era mitad de origen europeo y mitad africano e incluso la predisposición que tenía a padecer ciertas enfermedades, como la diabetes de tipo I.

Proporción de distintos donantes al genoma de referencia humano (Fuente).

¿Hay mucha diferencia entre el genoma de cualquiera de nosotros y el de referencia? Pues en algunos análisis realizados en grupos poblacionales de todo el mundo se ha encontrado que esta diferencia puede llegar a ser hasta de ¡14 millones de bases! Puede que os parezca poco respecto a 3 200 millones, pero justamente ahí, como veremos luego, puede residir el problema que cause una enfermedad genética.

Así pues, tenemos que el genoma de referencia humano que se usa en todas los análisis genómicos tiene varios huecos y además proviene en su mayor parte de una sola persona. Bueno, ¿qué más da? Al fin y al cabo todos tenemos ese genoma en un 99.9 %, ¿no? Pues lo cierto es que sí tiene su importancia porque en las secuenciaciones usadas para análisis clínico o investigación los fragmentos de ADN se alinean con este genoma de referencia.

Alineamiento de secuencias

Cuando se secuencia el genoma completo de un individuo (lo que conocemos como WGS, siglas de whole genome sequencing) no obtenemos directamente la secuencia de sus tres mil millones de letras, ordenadas como si de un libro se tratara. Los equipos de secuenciación más habituales (y baratos) rompen el genoma en trozos chiquitines, del orden de unas decenas de letras (de 100 a 250 bases es un número bastante habitual). Luego, como si estuviéramos resolviendo un puzle, debemos situar estas piezas sobre el dibujo de muestra, para así observar si hay diferencias que podrían explicar una patología. Este dibujo de muestra, equivalente al modelo que aparece en la caja de un puzle y nos guía para su resolución, sería precisamente el genoma humano de referencia. Para colocar estas pequeñas piezas, de las cuales hay del orden de millones, unos programas informáticos conocidos como alineadores buscan en qué posición del genoma de referencia puede encajar cada pieza, permitiendo pequeñas diferencias.

Una secuenciación de ADN lee pequeños fragmentos del genoma (en inglés, reads) que luego un programa de alineamiento intentará encajar (en inglés, mapping) sobre el genoma de referencia. Para ello, buscará posiciones en la referencia en las que las letras coincidan con el fragmento (en la figura se señalan con líneas que unen las letras de referencia y fragmento) permitiendo unos pocos errores (Fuente).

Los fragmentos que el programa alineador no consigue colocar sobre el genoma de referencia son descartados, como si no existieran. Ahora ya podréis entender el problema de que existan huecos sin resolver en el genoma de referencia, o de que existan muchas diferencias poblacionales que no aparezcan en esta referencia: si el alineador no encuentra dónde colocar las piezas de estas zonas conflictivas o ausentes, no las tiene en cuenta. Y a veces es justamente en estas piezas sin colocar donde se encuentra el problema.

La resolución de la maldición de Panay

Volvamos ahora a nuestros asuang, los enfermos de la distonía de Parkinson de la isla filipina de Panay. Una investigación publicada en 2018 en la revista Cell descubrió que no se había podido encontrar la causa genética de la enfermedad porque estaba localizada en un área del genoma que, aunque era común en una gran parte de los pobladores de la isla de Panay, no se encontraba en el genoma de referencia humano. Los fragmentos que se obtenían de este área al ser secuenciados, por lo tanto, se descartaban ya que no había ningún lugar del genoma donde encajarlos.

Para resolver este problema se analizó el área del genoma que se sabía implicada en la distonía pero sin usar el genoma de referencia humano. Para ello se intentaron unir los fragmentos de la secuenciación usando la información de solape entre dichos fragmentos (lo que equivaldría a hacer un puzle sin tener la foto): es lo que se conoce como ensamblado de ADN (lo explico mejor en este vídeo). En la siguiente figura se muestra esquemáticamente en qué consiste este proceso.

Imagen adaptada de esta fuente.

Al realizar este ensamblado de fragmentos se halló, como ya se ha comentado, una secuencia ausente en el genoma de referencia pero que sí se encontraba presente de forma habitual en la población de Panay (y que, por cierto, incluía la inserción de un retrotransposón) y era justo en esta nueva secuencia donde se producían los cambios que producían la enfermedad.

Este problema de secuencias de ADN comunes en determinadas poblaciones pero que no se encuentran en el genoma humano de referencia es bastante habitual. ¿Cómo podríamos resolverlo? Deberíamos tener una versión completa del genoma de referencia que eliminara esos vacíos y, además, incluyera todas las variantes posibles de la población, de manera que al intentar alinear cualquier secuenciación de un genoma se encontrara el sitio de todas las piezas. Esto justamente es lo que se pretende con el conocido como pangenoma humano, del cual hablaré en un próximo artículo.

Referencias



Por Guillermo Peris Ripollés, publicado el 6 enero, 2021
Categoría(s): Genética • Historia • Medicina
Etiqueta(s): ,