El valor de la inteligencia artificial en las bibliotecas
La biblioteca digital de la BnF, Gallica, está haciendo una labor encomiable en su campo. Ya cuenta con un fondo de cerca de nueve millones de documentos.
Una de las personas responsables de su gestión es Jean-Philippe Moreux, experto científico de la biblioteca. En una reciente entrevista da algunas notas importantes sobre las posibilidades de la implementación de la inteligencia artificial para la conservación y la difusión de fondos.
Para Moreux la IA es la oportunidad de procesar por fin la masa cada vez mayor de documentos conservados y depositados en la BnF. Una misión que considera imposible para que realicen los humanos sin la ayuda de estos software o herramientas, según el punto de vista del usuario (investigador o usuario final), como él mismo señala.
La diferencia, por ejemplo, entre el OCR (reconocimiento óptico de caracteres) y la IA actual es que ésta puede brindar la capacidad de procesar en masa grandes cantidades de datos de forma automática. Esto permite llevar a cabo tareas que serían casi imposibles de realizar humanamente.
Hoy las IA se pueden utilizar para leer y transcribir imágenes o voces, traducir textos o analizar casi cualquier tipo de producción humana. En las bibliotecas podrán enriquecer las colecciones ayudando a indexarlas, catalogarlas y transcribir manuscritos impresos, vídeos, música u otros contenidos que se ingieran cada día mediante depósito legal digital o programas de escaneo.
En concreto, desde 2020, la BnF ha implementado una hoja de ruta de IA para priorizar sus áreas de desarrollo. El proyecto más avanzado se llama ‘Gallica Images’, si bien la BnF también está trabajando para aplicar enfoques de IA a otros servicios de usuario o actividades internas.
En el caso del proyecto ‘Gallica Images’, este tiene como objetivo, a partir de todo el contenido digitalizado en Gallica, describir y caracterizar todas las partes de los documentos que contienen ilustraciones. El objetivo es crear automáticamente una base iconográfica.
En cuanto a la preocupación por la implementación de estas tecnologías, Moreux reconoce que es legítima, pero que, en este caso, se trata más bien de un cambio en la forma de trabajar que de una sustitución de los humanos por la IA. Aún se necesitan el conocimiento y a los científicos que tienen tal conocimiento para construir y enriquecer estos nuevos enfoques.
Incluso aunque ya haya bibliotecas en Asia y Estados Unidos con robots que encuentran o colocan libros en las estanterías, son a veces trabajo menos importante para un bibliotecario actual que, además, sin los propios expertos que enseñen y supervisen a estas máquinas cómo trabajar no existirían.
De momento las bibliotecas han comenzado a aplicar estas técnicas para tareas de catalogación, indexación de documentos impresos y digitales. La experiencia está demostrando que los catalogadores no han sido relevados, porque estos expertos en indexación contribuyen a la formación y el control de las IA. Lo que la IA indexa, el catalogador luego llega a verificar o eliminar dudas sobre la confiabilidad.
Lo que sí tiene muy claro Moreux es que las IA promoverán el acceso al fondo que ofrece Gallica, así como facilitar la investigación, como ya pasa en la actualidad con la multiplicación de contenidos y la apertura de datos, en particular en el campo de las ciencias humanas.