Open Book Genome, una IA que lee todos los libros del mundo
Open Book Genome es una inteligencia artificial que usa la Open Library para leer millones de textos y extraer información básica de ellos.
Recordemos que Open Library es un proyecto de trabajo de Internet Archive para buscar y catalogar todos los libros publicados en una única base de datos de libre acceso.
Con Open Book Genome, la Open Library quiere automatizar la lectura de los textos presentes en la biblioteca de Internet Archive, en este caso para extraer el “genoma” o ADN de cada título, es decir, su material genético, aquello que lo hace único.
El equipo detrás de este proyecto busca saber con la mayor precisión posible qué es lo que caracteriza a cada libro con la mayor precisión posible.
Es decir, ofrecer datos que vayan más allá del título, el autor y la fecha de publicación, metadatos básicos y necesarios. Lo que quieren es sacar otros datos permitan comprender la naturaleza exclusiva de una obra.
Como para analizar un libro con precisión, la lectura es la base fundamental, precisamente lo que hace esta IA es extraer los temas abordados, los lugares o incluso los personajes mencionados en el texto. Además, para ponerlos todos en el contexto, esta IA es capaz de leer todos los libros existentes para sacar de ellos sus rasgos distintivos.
Así, la primera parte del “proyecto genoma” se basa en la tecnología a través de la intermediación de un robot que “lee” todos los libros de la biblioteca de Internet Archive: 32 millones de obras. Esta inteligencia define primero algunos criterios de clasificación, en base a su análisis.
La segunda parte del proyecto es la que ya podría ofrecer a los lectores una clasificación más detallada de las obras identificadas por tal inteligencia artificial.
Lo que se busca finalmente es que ayude a que los datos relacionados con los libros sean más accesibles y útiles para el público.
Con ello se podrán mejorar las recomendaciones, las comparaciones entre libros, ofrecer resúmenes más completos, dirigirse al usuario de manera personalizada, destacando citas y fuentes mencionadas en otros libros, etc.