2/27/2013

Apostillas sobre analítica cultural. Jugando con N-gram

Recientemente me puse a explorar N-gram Viewer de Google. Es la primer herramienta de su tipo, capaz de cuantificar con precisión y rapidez tendencias culturales basándose ​​en cantidades masivas de datos (Big Data). El buscador está diseñado para que podamos examinar la frecuencia de aparición en libros de palabras simples (como por ejemplo: música) o frases compuestas (por ejemplo: "Provincias unidas del sur") a través del  tiempo. La búsqueda explora un corpus de más de 5,2 millones de libros, sí leiste bien: el 4% de todos los libros que se han publicado!

Mientras hago algunas pruebas con la app, ensayo un ejemplo que encontré en el sitio Culturomics en el cual se propone una búsqueda a partir de cuatro figuras destacadas de la historia de la humanidad en general y de la ciencia en particular: Galileo, Darwin, Freud y Einstein.
Copio y pego dichos nombres en la potentísima y atrapante aplicación de los Labs de la gran G y doy con este gráfico.



Como notarán, el volumen de menciones de los cuatro autores en el período comprendido por la búsqueda no es tan desigual como para llamar demasiado la atención (de 1869 a 1930 es Darwin el que despunta, quien a su vez es relevado de esa posición por Freud a partir del año 1950 en adelante), salvo por una rara excepción. En los años 1632 Galileo muestra un súbito ascenso en el gráfico el cual se mantiene hasta 1638 para volver a decaer de la misma manera en la que subió.

Revisitando la historia de quien fuera uno de los agentes de mayor peso en lo que se conoce como la revolución científica, encuentro que el pico de menciones en los libros de la época (en definitiva es eso lo que contabiliza N-gram a partir del análisis de una cantidad de datos gigantesca) que marca la app coincide con el año de publicación de su obra más controversial que lo llevara finalmente a la condena de parte de las autoridades esclesiásticas de la época.

Según Wikipedia, “el 21 de febrero de 1632, Galileo, protegido por el papa Urbano VIII y el gran duque de Toscana Fernando II de Médicis, publica en Florencia su diálogo de los Massimi sistema (Diálogo sobre los principales sistemas del mundo), donde se burla implícitamente del geocentrismo de Ptolomeo. El Diálogo es a la vez una revolución y un verdadero escándalo.”  Y N-gram Viewer lo confirma.

Mientras seguimos dando reportes de nuestra exploración de aplicaciones ligadas a la analítica cultural… nos regodeamos en la sensación de que hay mucho por hacer/aprender en la intención de enlazar el big data con una hermenéutica de los datos que genere aportes significativos en el terreno de las humanidades.

PD: No pasará demasiado tiempo para que hagamos un informe detallado sobre N-gram en este blog.

Enlaces relacionados:

Blog Widget by LinkWithin
 
clasiar