12 junio 2023

Internet Archive utiliza IA para extraer palabras de registros con 100 años

Internet Archive está explorando formas de usar herramientas de inteligencia artificial para mejorar su biblioteca audio.

De este modo, hace muy poco sus responsables de esta área daban a conocer que estaban experimentando desde hace un tiempo con Whisper, una herramienta de reconocimiento de voz de OpenAI, la compañía detrás ChatGPT y DALL-E.

Internet Archive tiene 1.600 ejemplos de restauraciones humanas de calidad de registros de 78 rpm donde se utilizaron las mejores herramientas para «restaurar ligeramente» los archivos de audio. Esto elimina el ruido de la superficie “áspera” mientras trata de no afectar la música o el habla.

Además, Internet Archive tiene más de 400.000 archivos sin restaurar que están bastante deteriorados y difíciles de escuchar.

El objetivo era  saber si un programa de IA podía tomar todos o muchos de los 400.000 registros no restaurados y hacerlos mucho mejores. Los evaluadores, una vez hecha la apuesta por Whisper, querían saber si esta herramienta podría extraer esas palabras habladas y cantadas de viejos y ruidosos registros en discos, en concreto de 78 rpm.

Los resultados fueron prometedores,  por ejemplo, la herramienta encontró la mayoría de las palabras de la canción “Cuando nos separamos en la puerta”, una grabación muy deteriorada en cuanto al sonido de nada menos que 1915.

Por tanto, las grabaciones y las transferencias fueron tan buenas que las herramientas automáticas pudieron distinguir muchas de las palabras.

Todas las grabaciones de 78 rpm son parte de Genial 78, un proyecto comunitario para la preservación y descubrimiento de registros antiguos que datan desde 1898 a la década de 1950. En la actualidad, hay más de 400.000 grabaciones disponibles cuidadosamente remasterizadas.

Todos los textos extraídos ahora están disponibles online de forma gratuita. Ayudarán a comprender mejor las grabaciones de Edison de hace 100 años y que fueron donadas Internet Archive por la Biblioteca de Santa Bárbara, de la Universidad de California.

Leave a Reply