24 septiembre 2015

Los libros como gran fuente y visualización de datos

Algoritmos, visualización de datos y mapas son conceptos con los que ya nos vamos familiarizando. Son una manera de analizar y evidenciar cualquier tipo de información.

En una de las bibliotecas digitales –y más que eso- más importantes del mundo, Internet Archive, con una labor más que meritoria, y a raíz de una iniciativa de Kalev Leetaru, experto, entre otras cosas, en visualización de datos y responsable del proyecto GDELT que trabaja en esa línea, se está trabajando en una de las mayores fuentes de datos del mundo en relación al libro.

Primero, mediante algoritmos y la captura de imágenes de los 600 millones de páginas de la colección de libros digitalizados de Internet Archive, junto al texto que acompaña a cada imagen y los metadatos básicos sobre el libro, se fue creando una galería de imágenes.

Pero no parecía suficiente, y después se pasó a la minería de datos masivos para que ‘leyeran’ cerca de 3 millones y medio de libros en inglés que se remontan a 1.800 para recoger datos, lugares, emociones, temas y todo tipo de menciones clasificables.

Junto al mencionado proyecto de mapeo y minería de datos GDELT, el resultado la cartografía de una gran parte de la bibliografía que recoge Internet Archive de la literatura e historias norteamericanas.

Se podría buscar en el mapa a través de lugares, menciones, hechos históricos, acontecimientos, contextualización con otros datos, etc.

En definitiva, una herramienta comparativa para el estudio basada en la recopilación y visualización de datos que da cuenta de la transformación que va a sufrir nuestra comprensión del mundo gracias a aplicaciones como esta que apenas muestran una parte de lo que pueden llegar a ser capaces.

Leave a Reply