Según un estudio publicado en PNAS, el análisis Big Data de las palabras contenidas en libros publicados desde 1850 hasta la actualidad sugiere que en las últimas décadas se ha producido una caída en el uso de palabras asociadas al pensamiento racional coincidente con un aumento de palabras relacionadas con lo emocional/intuitivo
Posmodernidad. Un concepto que ha generado tal cantidad de información que resulta difícil de condensar en una definición precisa. En estos casos lo más sencillo es acudir al diccionario de la RAE, que define la posmodernidad como “Movimiento artístico y cultural de fines del siglo XX, caracterizado por su oposición al racionalismo y por su culto predominante de las formas, el individualismo y la falta de compromiso social”. Habrá muchos que consideren insuficiente, parcial o sesgada esta forma de fijar el concepto, pero para nuestros propósitos nos vale. Asumamos que, en efecto, desde finales del siglo XX se ha producido una tendencia cultural, en el sentido más amplio del término, que valora el sentimiento y la emoción por encima de la razón y el argumento. Una tendencia que estima las formas, la imagen y las apariencias por encima del fondo. Que es fuertemente autorreferencial y no parece muy inclinada a promover cambios radicales en la organización y la estructura social.
Son muy numerosos los politólogos, filósofos, sociólogos y sicólogos que han estudiado este fenómeno y han debatido sus causas y consecuencias. Lo que ha sido mucho menos frecuente es una aproximación al fenómeno estrictamente cuantitativa, o dicho de otra forma, empleando procedimientos puramente empíricos. Por este motivo ha resultado tan sorprendente como controvertida la publicación en la prestigiosa revista Proceedings of the National Academy of Sciences U.S.A. (PNAS) de un estudio realizado por un grupo de psicólogos holandeses titulado: The rise and fall of rationality in language [1]. Sus conclusiones se pueden resumir de la siguiente forma. El pensamiento racional, tal como aparece reflejado en la frecuencia de uso de palabras publicadas en libros, aumentó de forma continua entre 1850 y 1980, para declinar rápidamente a partir de este año. La reciente caída en la frecuencia de palabras asociadas con la racionalidad coincide con un ascenso del uso de palabras relacionadas con la intuición (Figura 1). Este cambio es paralelo a un incremento en la frecuencia de términos individuales frente a los colectivos. En pocas palabras, en los últimos cuarenta años se habría producido un cambio radical en cuanto al interés público, desde lo racional hacia lo intuitivo/emotivo, del ámbito colectivo al individual, y este cambio habría dejado una huella en la frecuencia con la que las palabras aparecen en los libros.
Para entender mejor las conclusiones hay que describir el material bibliográfico en el que se ha basado este estudio. Hace diez años, un grupo de jóvenes estudiantes e investigadores de la Universidad de Harvard elaboró un ingente corpus documental que incorporaba más de cinco millones de libros publicados entre 1800 y 2000 [2]. Esto supone alrededor del 4% de todos los libros publicados en ese periodo. La digitalización de estos libros permitió disponer de una base de datos de 500 mil millones de palabras en siete idiomas diferentes, 45 mil millones de ellas en español. Posteriormente se amplió la base de datos hasta el año 2019 en el marco del proyecto Google Books Ngram. Todo este material ha sido puesto a disposición del público, a través de las direcciones https://books.google.com/ngrams o en la web de los autores del trabajo: www.culturomics.org. El nombre de esta web hace referencia a la “Culturómica” un término acuñado en la estela de las “-ómicas” o disciplinas biológicas basadas en el análisis masivo de la información. Según sus creadores, la culturómica sería la aplicación del análisis de grandes cantidades de datos al estudio de la cultura humana.
Google Books Ngram fue la plataforma que usaron Scheffer y sus colaboradores para su investigación. Como punto de partida seleccionaron las 5000 palabras de uso más frecuente en español e inglés. Sobre esta selección realizaron un análisis de componentes principales para determinar los ejes que explicaban las mayores varianzas en la frecuencia de uso de estas palabras. El primer eje mostraba una tendencia constante a lo largo del periodo 1800-2018. El examen de las palabras situadas en los extremos de esta tendencia revelaba sencillamente un cambio en la “popularidad” de dichas palabras. Dicho de otra forma, lo que se manifestaba en este eje era la evolución natural del léxico. Por ejemplo, en un extremo se sitúan términos más arcaicos como “carruaje”, “sheriff” o “salvaje”, mientras que en el otro aparecen palabras modernas como “tecnología”, “ordenador” o “alérgico”.
Lo más interesante residía en el segundo eje de componentes principales, que a diferencia del anterior sí mostraba un fuerte punto de inflexión hacia 1980 (Figura 1). Antes de esa fecha, los términos predominantes aparecían relacionados con ciencia, procesos, sistemas o decisiones racionales. En la muestra analizada del léxico español aparecen en esta parte de la gráfica palabras como: ciencia, tecnología, científico, química, productos, física, medicina, modelo, método, datos, hipótesis, estadísticas, cálculo, análisis, conclusión, límite o porcentaje. Una lista muy similar aparece cuando se analiza la muestra de textos en inglés. En cambio, la parte derecha de la gráfica, más allá de la inflexión localizada en torno a 1980, contiene conceptos más relacionados con la experiencia personal, las emociones o las relaciones humanas. En el léxico español destacan: espíritu, imaginar, sabiduría, mente, sospecha, creer, pensar, fe, verdad, duda, esperanza, miedo, vida, alma, cielo, santo, dios, misterio, sentido, sensación, sentir, suave, duro, frío, caliente, oír, silencio, fuerte, ver, mirar... De nuevo, el léxico inglés se comportaba de la misma forma en este periodo. En el caso del idioma inglés fue también posible distinguir entre libros de ficción y no-ficción. En ambos casos el patrón se repetía, por lo que no estaba relacionado con el tipo de literatura utilizado.
Los autores de este trabajo hicieron varias pruebas para corroborar sus conclusiones. En primer lugar utilizaron una valoración del sentimiento o la reacción que producen las palabras en los humanos. En inglés existe una base de datos llamada ANEW (Affective norms for english words), creada por Bradley y Lang [3] y expandida por Warriner y cols. [4], que asigna a cada una de las casi 14000 palabras que contiene una puntuación en función del sentimiento positivo/negativo o el grado de emoción que producen en grupos de sujetos. Por ejemplo, “tortura”, “terrorismo” o “adormilado” obtienen puntuaciones muy bajas en la escala, mientras que “vacaciones”, “libre” o “tornado” están en la parte alta. Existe una adaptación al español hecha por Redondo y cols. [5], también usada por los autores del estudio. Cuando se calculó el “sentimiento promedio” de las 5000 palabras seleccionadas en inglés y español a lo largo del periodo estudiado, se constató que el patrón obtenido era muy similar al derivado de la selección de palabras “racionales” o “emocionales”, es decir, un descenso más o menos marcado en sentimientos y emociones asociados al léxico desde 1850 hasta 1980, seguido de un brusco aumento del, digamos, “nivel emocional” de las palabras en las cuatro últimas décadas.
Otra prueba independiente consistió en comprobar la frecuencia de aparición en el New York Times de las palabras clave identificadas en el análisis de componentes principales. Una vez más el patrón se reprodujo, la proporción entre la frecuencia de las palabras “racionales” y las “intuitivas” aumentaba entre 1850 y 1980 para caer después de esa fecha. Esto sugería que el fenómeno no afectaba solamente al material impreso en libros. Por otro lado los autores del artículo en PNAS encontraron una correlación entre la frecuencia de uso de las palabras y la frecuencia con que estas palabras eran buscadas en Google, sugiriendo que el uso de los términos en libros es un reflejo del interés del público en dichos términos.
La conclusión del estudio de Scheffer y sus colaboradores es provocativa. Durante 130 años el léxico inglés y español publicado en los libros revelaría un progresivo aumento del pensamiento racional, una tendencia rota de forma brusca hacia 1980, cuando el pensamiento intuitivo y emocional, podríamos llamarlo “posmoderno”, adquiriría preponderancia. Algo que los autores consideran como una posible reacción contra el proceso de “desencantamiento del mundo” en palabras de Max Weber. Esta conclusión sin duda generará polémica, y de hecho ya se han producido reacciones en el breve lapso transcurrido desde su publicación. Hay que reconocer que algunas de estas críticas habían sido asumidas ya en la publicación original. Sus autores admiten que la cultura impresa no tiene por qué ser reflejo fiel de la cultura en general, que el uso de muchos términos está influido por el contexto, o incluso que algunos de ellos cambian de significado a lo largo del tiempo.
Una crítica más enérgica fue publicada en la misma revista PNAS el pasado mes de enero, un mes después de que viera la luz el artículo de Scheffer y colaboradores. Esta crítica fue publicada en forma de comentario por Simon DeDeo, profesor de la Universidad Carnegie Mellon y el Instituto de Santa Fe, un prestigioso centro de investigación sobre sistemas complejos [6]. DeDeo reconoce el interés del estudio publicado por los holandeses, al que califica de “excitante”, pero señala algunas debilidades. Por ejemplo, que las bases de datos no recogen el impacto real de los libros, es decir, su número de lectores. Por ejemplo, argumenta DeDeo, la frecuencia de la palabra “Derrida” es aproximadamente la mitad de la frecuencia con la que aparece “depresión”. Parece obvio que los libros que tratan del filósofo francés cuentan con muchísimos menos lectores que los volúmenes que mencionan la depresión. Por tanto, las palabras “racionales” que deben aparecer en los primeros, estarán sobrerrepresentadas en el estudio respecto a las palabras “emocionales” que pueblan sin duda las páginas de los segundos. La replicación del análisis sobre otros diarios, como The Guardian, muestra una tendencia similar a la del New York Times, pero el cambio parece producirse en la década de los 50, no en los 80. Por otro lado, DeDeo se pregunta si las tendencias detectadas en el uso del léxico representan auténticos cambios de la realidad psicosocial o son más bien reflejo de la evolución del interés por unas palabras u otras, o del prestigio cambiante de maneras de expresarse por escrito.
Es muy probable que la controversia se siga desarrollando en los próximos meses. En cualquier caso, aparte del interés intrínseco de la sugerente conclusión del estudio de Scheffer y colaboradores, el fondo de esta cuestión es la disponibilidad de nuevos procedimientos de estudio de los cambios culturales y sociales a partir de análisis Big Data, la “culturómica” que mencionábamos antes. No solo los libros, cada vez más será posible analizar masivamente contenidos en redes sociales, medios audiovisuales y otras fuentes. Por citar solo un curioso ejemplo de lo que viene, un grupo angloamericano de informáticos han mostrado como los algoritmos de personalización que generan la cronología de inicio de Twitter (los tweets que la plataforma selecciona cuando entramos en nuestra cuenta) amplifican más los mensajes políticos de derecha que los de izquierda [7]. Curiosamente, entre los siete países comparados, es España la que muestra un mayor sesgo de amplificación para los mensajes de la derecha, y en concreto del Partido Popular. Pero mejor dejamos esto para otra ocasión. Para los interesados en esta aproximación “del texto al pensamiento” recomendamos la excelente revisión publicada por Jackson y cols. [8].
Gracias a Internet, las herramientas para estos análisis son accesibles al público, como antes indiqué. Es muy probable que nuestros lectores se animen a usarlas. A título de curiosidad voy a mencionar algunos ejemplos de cómo Google Books Ngram puede darnos información sobre la evolución de nuestro léxico. Recordemos que se trata de libros publicados en español, no necesariamente en España, aunque nuestro país sea el editor mayoritario de estos libros. Lo podemos tomar como un juego… ¿O es algo más? Veamos.
Hemos mencionado por ejemplo el creciente individualismo que supuestamente caracteriza las actitudes posmodernas. ¿Cómo se reflejaría esto en el corpus de libros publicados en español? Como vemos en la figura 2 los posesivos “mi, mío y mía”, cuya frecuencia estaba igualada con sus plurales correspondientes (nuestro y nuestra) desde los años 40 hasta los 80 del siglo pasado, aumentan de forma llamativa a partir de principios del siglo XXI. De forma similar el personal “yo”, que evoluciona paralelamente a sus plurales (nosotros y nosotras), también incremente su frecuencia por las mismas fechas. Es curioso comprobar que otro periodo de supuesto individualismo, menos marcado que el actual, se insinúa alrededor de 1860, una época muy inestable de nuestra historia.
Google Ngram permite seguir el ascenso y caída de algunas palabras de moda. Recordamos bien los años en que todo era o debería ser “ecológico”. Más recientemente se vendía mejor aquello que fuera “sostenible” hasta que apareció un adjetivo más enjundioso, “resiliente”. Esta evolución se aprecia perfectamente en la figura 3. Por cierto, es muy ilustrativo ver como la frecuencia de expresiones de moda como las ya citadas o, por ejemplo, “hoja de ruta”, asciende primero en inglés, y pocos años después el español reproduce dócilmente la misma tendencia.
El llamado “lenguaje inclusivo” ha sido objeto de fuertes debates en los que no vamos a entrar ahora. Pero su aplicación en lo que se refiere al masculino+femenino, parece dar señales de cansancio de acuerdo con los gráficos (figura 4). El pico de frecuencia de esta forma de entender el lenguaje inclusivo se registra en la primera década de este siglo, para descender en los últimos años, aunque es cierto que se está registrando una reciente recuperación.
Para terminar, vamos a ver cómo ha evolucionado a lo largo de las últimas décadas la frecuencia de palabras referidas a valores especialmente importantes. Por ejemplo, conceptos como libertad, igualdad, participación, democracia o solidaridad no parecen ser muy populares en los últimos años a juzgar por su frecuencia de uso en libros (figura 5). “Compasión”, un término con fuertes connotaciones emocionales, es el único entre los elegidos que ha aumentado en dicho periodo. Obsérvese cómo la palabra “libertad” ha estado más presente en los libros en español durante los años 50 y 60 que en ningún otro periodo. Y también es llamativo el uso muy frecuente de la palabra “participación” a partir de los años 70, para desplomarse en la última década.
En cambio, si nos movemos en el campo semántico de la diversión, las cosas son muy diferentes (figura 6). A partir de 2005 palabras como placer, alegría, felicidad, o fiesta, que habían descendido durante las primeras décadas de la democracia, aumentan de forma espectacular. Es curioso comprobar cómo estas palabras aparecían más frecuentemente en los libros publicados en los años 50 o 60 que en las décadas de la joven democracia española.
¿Contienen las palabras información sobre nuestra forma de ver y sentir el mundo más allá de su estricto significado? La Royal Society of London for improving natural knowledge, más conocida como la Royal Society, es una de las más antiguas y prestigiosas sociedades científicas del mundo. Su historia es fascinante, pero no podemos detenernos ahora en ella. Fue fundada en 1662, y al año siguiente adoptó como lema la expresión “Nullius in verba”, tomado de las epístolas de Horacio. Esta frase puede interpretarse como “en las palabras de nadie”, es decir, no debemos sentirnos obligados o condicionados por las palabras de los demás, ya que la fuente del conocimiento se basa en nuestra experiencia. Es toda una declaración de intenciones del empirismo británico que se desarrolla a lo largo de los siglos XVI y XVII. Poco podían imaginar los que así desconfiaban de las palabras que estas podrían convertirse en el siglo XXI en un material sobre el que aplicar procedimientos estadísticos, dando lugar a modelos e hipótesis. Google Books Ngram no es más que un primer paso en esa dirección. De momento solo es un termómetro que nos puede dar la temperatura del cuerpo social. No nos dice nada sobre sus enfermedades, las causas o el pronóstico de las mismas. Pero creo que los datos que nos proporciona nos animan a la reflexión. Por cierto, esta hermosa palabra, “reflexión”, aparece en los libros publicados en 2018 poco más de la mitad de las veces que en 2003…
Este artículo nos lo envía Ramón Muñoz-Chápuli (Granada, 1956) ha sido catedrático de Biología Animal en la Universidad de Málaga hasta su reciente jubilación. Ha publicado un centenar de artículos científicos sobre Biología del Desarrollo y Evolución Animal en revistas nacionales e internacionales, además de numerosos artículos divulgativos. Su docencia se ha centrado sobre todo en estos temas, aunque ha impartido también clases de Historia de la Biología y Filosofía de la Ciencia a nivel de posgrado. Ha sido Vicedecano de la Facultad de Ciencias y Director de la Escuela de Doctorado de la UMA. Es autor de varios relatos premiados en certámenes literarios y de la novela histórica El sueño del Anticristo.
Referencias
[1] Scheffer M, van de Leemput I, Weinans E, Bollen J. The rise and fall of rationality in language. Proc Natl Acad Sci U S A. 2021 Dec 21;118(51):e2107848118. doi: 10.1073/pnas.2107848118.
[2] Michel JB, Shen YK, Aiden AP, Veres A, Gray MK; Google Books Team, Pickett JP, Hoiberg D, Clancy D, Norvig P, Orwant J, Pinker S, Nowak MA, Aiden EL. Quantitative analysis of culture using millions of digitized books. Science. 2011 Jan 14;331(6014):176-82. doi: 10.1126/science.1199644.
[3] Bradley MM, Lang PJ (1999) Affective Norms for English Words (ANEW): Stimuli, Instruction Manual and Affective Ratings. Technical report c-1 (Univ of Florida, Gainesville, FL).
[4] Warriner AB, Kuperman V, Brysbaert M. Norms of valence, arousal, and dominance for 13,915 English lemmas. Behav Res Methods. 2013 Dec;45(4):1191-207. doi: 10.3758/s13428-012-0314-x
[5] Redondo, J., Fraga, I., Padrón, I. & Comesaña, M. The Spanish adaptation of ANEW (affective norms for English words). Behavior research methods 39, 600-605 (2007).
[6] DeDeo S. Using big data to track major shifts in human cognition. Proc Natl Acad Sci U S A. 2022 Jan 25;119(4):e2121300119. doi: 10.1073/pnas.2121300119.
[7] Huszár F, Ktena SI, O’Brien C, Belli L, Schlaikjer A, Hardt M. Algorithmic amplification of politics on Twitter. Proc Natl Acad Sci U S A. 2022 Jan 4;119(1):e2025334119. doi: 10.1073/pnas.2025334119.
[8] Jackson JC, Watts J, List JM, Puryear C, Drabble R, Lindquist KA. From Text to Thought: How Analyzing Language Can Advance Psychological Science. Perspect Psychol Sci. 2021 Oct 4:17456916211004899. doi: 10.1177/17456916211004899.
Si tienes un artículo interesante y quieres que lo publiquemos en Naukas como colaborador invitado, puedes ponerte en contacto con nosotros.