Los audiolibros producidos con voces IA enganchan tanto como los narrados por humanas
Audible, una de las mayores plataformas de audiolibros del mundo, acaba de ofrecer el argumento más sólido para que las agencias literarias y las editoriales dejen de debatir si adoptar la narración por IA y empiecen a decidir cómo hacerlo.
Los 50 millones de minutos escuchados de audiolibros producidos con voces sintéticas, compartidos por Lee Garit de Audible en el encuentro USBS26, organizado por Publisher’s Weekly, no son solo una cifra de consumo de contenidos audio. Son una señal de mercado que dice algo muy concreto: los oyentes, cuando el contenido audio está bien producido no rechazan la narración por ser IA.
Menos del 5% de los libros electrónicos disponibles en el mercado cuentan con una versión en formato audiolibro. Las editoriales poseen catálogos enormes (fondos históricos, títulos agotados, obras de nicho, etc.), pero que desgraciadamente son prácticamente invisibles en las plataformas de audio. Durante décadas, las editoriales no han podido desbloquear el potencial de crecimiento digital de sus catálogos por limitaciones presupuestarias. El coste de producción de un audiolibro con narrador humano de una novela de 300 páginas, que representa 8 horas de audio, oscila entre los 2.000 y los 10.000 euros por título, según el mercado. Para un fondo una editorial mediana con quinientos títulos, la matemática es prohibitiva.
Tras superar la lógica y humana postura de percibir a la tecnología como una amenaza hacia la creación humana, los profesionales del sector editorial y las plataformas de streaming están redescubriendo las herramientas IA como palancas de innovación que permiten optimizar la gestión de sus catálogos audio, personalizar la producción de audiolibros y ficciones sonoras por idiomas, acentos regionales, singularidades de las categorías, así como automatizar tareas de producción y administrativas repetitivas, entre otros muchos procesos.
Según el recientemente publicado «Mapa de herramientas IA más utilizadas por el sector cultural en español» (Anuario de Cultura Digital AC/E), los procesos de producción (28,2%) y la creación de contenidos generativos (18,8%) son los usos principales de las herramientas IA en el sector cultural, seguido por el uso de modelos (13,8%) y las herramientas de gestión (10,3%) y, en menor medida, las plataformas de distribución y canales de venta (7,7%), el diseño sonoro y audiovisual (6%) y las herramientas de traducción (4,3%).
En este contexto de un amplio abanico de usos de las herramientas IA, la producción con voces IA desbloquea el potencial de los catálogos editoriales. Al reducir drásticamente los costes de producción, convierte en económicamente viables los títulos que nunca habrían llegado al mercado audio: el fondo del catálogo, los libros de categorías especializadas, los libros de jóvenes autores aún desconocidos, las obras singulares del catálogo, pero publicadas hace décadas, las traducciones a idiomas de menor volumen de mercado, etc. Al producir estos libros en formato audiolibros con voces IA, los autores, sus agencias literarias y las editoriales ganarán más dinero al generar más royalties por escuchas en las plataformas
El debate sobre si la voz sintética es «aceptable» ya lo ha resuelto el mercado. Los audiolibros producidos con voces IA enganchan tanto como los narrados por humanas
El modelo que se está imponiendo en el sector editorial no es «IA para todo» ni «narrador humano para todo». Es un modelo híbrido de tres velocidades:
- Las apuestas editoriales del año serán producidas con narradores humanos con varios actores y con gran diseño sonoro para crear una experiencia de escucha muy inmersiva. La mega-producción sonora como parte del valor del producto.
- La mayoría de las producciones serán híbridas, es decir se utilizarán voces humanas pero asistidas por herramientas IA en las diferentes fases de la producción (antes, durante y después) para mejorar los procesos de producción y reducir costes.
- Producción completa con IA: para títulos de fondo, categorías nicho, idiomas con menor recorrido en el mercado y los títulos de baja demanda que de otro modo nunca llegarían al formato audio.
La decisión editorial inteligente no es elegir un modelo, sino asignar el modelo correcto a cada segmento del catálogo. Esto requiere que el departamento editorial y el de producción trabajen juntos con criterios claros: ¿qué hace que un título sea candidato a narración humana? ¿Volumen de ventas previstas, relevancia en el catálogo, número de obras del autor, categorías específicas, potencial de crecimiento en audio?
Definir los criterios estratégicos antes de empezar a producir evita tomar decisiones a corto plazo y garantiza coherencia en la estrategia audio de las editoriales.
Javier Celaya
(Socio-fundador de Dosdoce.com)





