El Proyecto Gutenberg y Microsoft se alían para crear audiolibros accesibles
El Proyecto Gutenberg quería que su colección de audiolibros fuera más accesible para una comunidad más amplia de miembros, incluidas personas con discapacidad visual y personas de todo el mundo que podrían no tener acceso a las bibliotecas tradicionales.
Para lograr este objetivo, la organización ha colaborado con Microsoft en una solución impulsada por IA para crear audiolibros a escala, creando casi 5.000 nuevos audiolibros.
A medida que la biblioteca del Proyecto Gutenberg siguió creciendo, su colección de audiolibros sigue siendo limitada a pesar de la creciente popularidad de este formato.
Según Greg Newby, Director y CEO del Proyecto, crear grabaciones de alta calidad estaba más allá de la capacidad de su equipo de voluntarios. Por eso, para hacer que su colección sea más accesible para una comunidad más amplia de miembros, incluidas las personas que viven en comunidades rurales y no tienen acceso a una biblioteca física, las personas con discapacidad visual, los niños que están aprendiendo a leer y los que prefieren escuchar libros, el Proyecto Gutenberg estaba interesado en una forma escalable de crear audiolibros.
Entonces, un equipo de Microsoft propuso una colaboración para producir miles de audiolibros de alta calidad utilizando dicha solución impulsada por IA. Estas nuevas grabaciones de audio han hecho que los libros del Proyecto Gutenberg sean más accesibles para una audiencia más amplia de personas en todo el mundo, incluidas aquellas que se enfrentan a desafíos de accesibilidad.
En Proyecto Gutenberg primero se cargan los ebooks existentes de su colección en Microsoft Azure Synapse Analytics para permitir trabajar con grandes cantidades de datos.
Después analizan los libros con Azure Synapse Analytics y usan la biblioteca de ML de SynapseML para crear grabaciones de audio usando la capacidad neuronal de ‘texto a voz’ de los servicios de IA de Azure.
Así se convierte el texto de cada libro en audio utilizando voces sintéticas similares a las humanas que incluso pueden transmitir emociones.
Es decir, las voces están “entrenadas” para imitar a los humanos a fin de que suenen más naturales. El resultado supone una gran mejora con respecto a las versiones anteriores de ‘texto a voz’.
Algunos de los audiolibros generados por IA, como las grabaciones de las obras de Shakespeare, incluyen diferentes voces para representar varios personajes. También pueden generar voces similares a las humanas en otros idiomas y ajustar las voces para leer con más emoción.
Los audiolibros generados se guardan como archivos MP3 en Azure Data Lake para su distribución a través de la web del Proyecto Gutenberg y otras plataformas de podcasts como LibriVox, Internet Archive, Spotify, Apple Podcasts y Google Podcasts.
En comparación con la producción tradicional de audiolibros con actores de doblaje o lectores voluntarios, la solución impulsada por IA proporciona un ahorro de tiempo espectacular para el Proyecto.