Interrogando a Hermes: análisis de expresión génica

Por Guillermo Peris Ripollés, el 2 febrero, 2021. Categoría(s): Divulgación • Genética
Paisaje con Apolo custodiando los rebaños de Admeto y Mercurio robándoselos (1654) de Claude Lorrain (fuente).

Seguimos en este artículo con la serie de Hermes y la expresión génica que se inició en una publicación anterior; entonces ya hablamos del ARN mensajero como nuestro Hermes celular por la función de ambos de transmitir «mensajes».

Hermes fue un niño precoz y a los pocos días de nacer ya la lio; por algo era hijo de quien era, del mismísimo Zeus, oye. Y su madre era Maya, una hija de Atlas (no, no era la abeja). Como decía, a los pocos días de nacer ya se escapó de la cuna y se echó al monte, cual bandolero. Y, como todos los pequeños, tenía ganas de jugar al escondite; el problema es que lo hizo con el ganado de su hermano Apolo, robándole los bueyes, sacrificando un par a  los dioses y escondiendo el resto en una cueva. Parece ser que, para que no encontraran su rastro, Hermes ató unas ramas a la cola de los bueyes y, tirando de ellas, los hizo caminar hacia atrás para así confundir al que siguiera las huellas.

No contento con eso, volviendo a su cueva en el monte Cilene se encontró con una tortuga y se le ocurrió inventar la lira utilizando su caparazón junto con las tripas de los bueyes sacrificados como cuerdas. Cansado de tanto esfuerzo, se metió en la cuna y se quedó dormido.

En cuanto Apolo se dio cuenta de que le habían robado su ganado enseguida supo que había sido su hermano; no le costó demasiado esfuerzo ya que entre sus poderes estaba el de clarividencia. Enfadado se fue directo a hablar con el padre de ambos, Zeus, pidiéndole cuentas sobre el robo. La madre se puso de parte del chiquitín, con la excusa de que era un recién nacido y no tenía capacidad de ejecutar los planes que decían, pero no convenció a Apolo, quien pidió a su padre que interrogara a Hermes y le hiciera confesar su crimen.

Hermes atándose la sandalia, de Lisipo (copia del siglo II – Fuente).

Como ya expliqué, en nuestras células tenemos a nuestro Hermes particular, el ARN mensajero (ARNm para abreviar). Lo que pretendo explicar ahora es justamente cómo podemos interrogar a nuestro Hermes para sacarle toda la información que podamos y que confiese sus crímenes.

Expresión diferencial de genes

En el artículo anterior ya definimos la expresión génica como el número de transcripciones que realiza una célula de un gen concreto. Vimos que, según el tipo de célula, se activan más unos genes y se reprimen otros. El cálculo de la expresión génica nos daba una idea de qué genes eran más activos y cuáles menos, y para obtenerlo recurrimos a la secuenciación de ARN.

En ocasiones, las células pueden variar la expresión de sus genes debido a circunstancias diversas; por ejemplo, por una enfermedad (como un cáncer) o porque se suministra un fármaco. En ambos casos nos interesa conocer qué cambios ocurren a nivel celular, y en concreto cómo cambia la expresión génica. A este análisis en que tratamos de estudiar qué cambios ocurren en la fabricación de proteínas debido a un cambio de las condiciones celulares le denominamos análisis de expresión diferencial de genes. Lo explico con más calma.

Imaginemos que queremos evaluar un tratamiento farmacológico en células in vitro. Para ello, tenemos una serie de placas de Petri con células humanas (por ejemplo, las conocidas células HeLa); en un conjunto de ellas aplicamos el fármaco y en otro (el grupo de células de control) no hacemos nada o añadimos una sustancia sin efecto farmacológico. Al final del experimento nos interesa saber qué genes han variado más su expresión, bien aumentándola o bien disminuyéndola, respecto a las células control no tratadas con fármaco.

Otro ejemplo en el que resulta interesante el análisis de expresión diferencial de genes es el estudio del cáncer. Este es el caso que voy a explicar con más detalle. Imaginemos que queremos estudiar qué ocurre en las células tumorales del cáncer de mama, un tumor muy agresivo que afecta a un gran número de mujeres. Para entender qué ocurre a nivel de expresión, necesitamos comparar células de mama sanas con células tumorales. Por ejemplo, en el caso simplificado presentado en la siguiente imagen, nos interesaría decir que en las células tumorales disminuye la expresión del Gen 1 y aumenta la del Gen 2.

Para explicar mejor cómo hacemos un análisis de expresión diferencial voy a tomar muestras de secuenciación de ARN en las que ya se ha calculado la expresión (las cuentas de cada gen). En la web del proyecto TCGA se pueden descargar gratuitamente estas muestras; yo he elegido tres pacientes concretos, que para garantizar su anonimato reciben los nombres de BH-A0AY, BH-A0HA y E9-A1N4. De cada uno de estos pacientes se han extraído y analizado células tumorales y sanas del mismo tejido (en este caso, la mama). Así, partimos de una tabla parecida a la siguiente:

Veamos con calma esta tabla. En columnas tenemos las células analizadas, indicando para cada individuo si son las sanas o las tumorales. En filas tenemos los genes cuya expresión se ha analizado. Los números del interior son las cuentas de expresión de cada gen en las células analizadas. Si lo pensáis bien, esta tabla tiene la misma estructura que la imagen que la antecede.

Aquí ya podemos sacar algunas conclusiones a ojo (intentad comprobar lo que digo mirando la tabla): por ejemplo, el gen TSPAN6 reduce su expresión en las células tumorales de los tres pacientes respecto a las células sanas. Y, en esta tabla, este gen es el que más se expresa en células sanas, ¿verdad? Por el contrario, el gen FGR apenas varía su expresión en células tumorales. Fácil, ¿no?

Bueno, no tanto. En la tabla sólo os he enseñado 6 genes al azar, pero el análisis tiene más de 56 000 filas (no todas son genes, pero eso ahora no importa). Y no sé vosotros, pero yo no tendría ganas de mirar una a una para ver qué genes aumentan su expresión o la disminuyen; para eso tenemos la informática.

Existen programas optimizados para realizar análisis de expresión diferencial partiendo de tablas de cuentas de ARN como la de arriba. Un conocido programa es DESeq2, que tras introducirle los datos de nuestros tres pacientes anónimos nos proporciona una tabla de resultados como la siguiente.

De nuevo, paremos un instante para intentar entender los aspectos más interesantes de esta tabla (en la que, de nuevo, sólo se muestran las seis primeras filas). En la primera columna a la izquierda se leen nombres extraños que se corresponden con genes. En la segunda columna, etiquetada como baseMean, aparece un número que sería algo así como la expresión promedio del gen en todas las muestras; para entendernos, parece que el gen que más se expresa en la tabla sería KRT15 y el que menos BBOX1.

Vamos a la columna log2FoldChange. Aquí se explica cuánto ha cambiado la expresión del gen en las células tumorales respecto de las sanas. Simplificando, un número positivo más grande indica que el gen se expresa mucho más en el tumor que en las células sanas (por ejemplo, el gen COMP); y cuanto más negativo es log2FoldChange menos se expresa en las células tumorales respecto a las sanas (es lo que ocurre en el resto de genes en la tabla; el gen en el que más se reduce la expresión es KRT15).

Por último, las columnas pvalue y padj nos dicen si esta diferencia es estadísticamente significativa: cuanto más cercanos a cero son estos números, más probable es que la diferencia que encontramos no sea casual. Que son más fiables, vaya. De hecho, la tabla se muestra ordenada de valores más pequeños de padj (los más fiables) a valores más grandes (menos fiables). Ojo, que 2.2e-52 es la abreviatura de 2.2 x 10 elevado a la menos 52, es decir, es un número que empieza por “0.” y al que le siguen 51 ceros y luego 2.2 (o sea, prácticamente cero).  En general, consideramos que la variación es real y significativa si padj es menor que algún valor umbral (por ejemplo, padj < 0.05). Deberás fiarte de esta explicación porque excede del contenido de este artículo hablar de la estadística de los p-valores.

En el artículo anterior ya se comentó que una forma de ver los genes cuya expresión varía más en las células tumorales era los mapas de colorines (heatmaps). En estos gráficos se representan los genes con diferencias más significativas mostrando en colores rojos las expresiones altas y en azules las bajas (por eso del caliente y el frío). Aquí tenéis un gráfico de colorines para nuestra pequeña investigación; fijaos en que se separan en columnas las tres muestras de células normales y las tres de tumor, y en filas los distintos genes (bueno, sólo los más importantes). También he separado los genes en los que aumenta la expresión en el tumor (diez filas de arriba) de aquellos en los que disminuye (diez filas de abajo).

Si tienes conocimientos del lenguaje de programación R puedes hacer este análisis tú mismo y obtener esta gráfica con el mismo programa que yo escribí para ello y que puedes encontrar aquí.

Es en este momento cuando los bioinformáticos nos apartamos y dejamos a los biólogos expertos que analicen cuál es el papel en el tumor de los genes encontrados en el análisis de expresión diferencial (bueno, no es realmente así; podemos seguir con otros análisis, como un análisis de sobrerrepresentación o un análisis de enriquecimiento de genes, pero no es cuestión de complicaros más la vida).

Hermes y Apolo

¿Cómo acabó el asunto del robo de Hermes del ganado de Apolo? Pues como era algo de familia, al final no llegó la sangre al río. Zeus no se tragó lo de que Hermes era un bebé y al final consiguió que devolviera el ganado escondido a su hermano. ¿Os acordáis de la lira que inventó Hermes con un caparazón de tortuga e intestinos de buey? Pues a su hermano mayor le gustó tanto cómo sonaba ese nuevo instrumento que le propuso a Hermes quedársela a cambio de sus bueyes. No sólo eso, sino que Apolo también le regaló el cayado de pastor que solía llevar, que Hermes tunearía dándole forma de caduceo, con el que podía abrir y cerrar los ojos de los hombres.

Mercurio y Apolo se intercambian la lira y el caduceo. Fresco de Annibale Carracci en la Galería Farnesio, finales del siglo XVI (Fuente).