Narraciones post mortem en audiolibros

Imagen de Vincent Nguyen en Pexels
La startup de audiolibros con inteligencia artificial DeepZen, con sede en Londres, desarrolló un sistema que puede crear grabaciones de audio deepfake de actores de doblaje vivos, pero también muertos, y con un rango emocional en las voces verdaderamente llamativo.
Cuando anunciaron que su herramienta era capaz de reproducir la voz de actores que habían fallecido lo hicieron con la voz de Edward Herrmann. La familia del actor cedió los derechos de su famosa voz (de hecho ganó premios por narrar audiolibros) a DeepZen para que la usara en sus audiolibros. La empresa ya ha realizado decenas de audiolibros utilizando la voz de Herrmann.
Para lograr esto DeepZen crea una versión de IA de su voz que puede generar cualquier sonido y entonación que, en este caso el fallecido Herrmann, hubiera usado si estuviera narrando estos nuevos libros él mismo.
En el momento en que DeepZen hizo este anuncio señaló que esperaba cerrar más acuerdos con los herederos de estrellas fallecidas. Si bien trabajan con actores profesionales para capturar una amplia gama de emociones humanas y así enseñarle a su sistema de IA a reproducir las voces (los actores -o sus herederos- reciben por adelantado honorarios fijos y regalías por participar), no parece que la idea haya calado entre los posibles herederos.
No es la única compañía que ofrece servicios de audio de ultratumba, por así decir. Vidnoz AI, ETXStudio, Voice AI, Podcastle.ai son algunas de ellas, y seguro que habrá muchas más. En realidad cualquiera que con unos segundos de grabación del fallecido (sabiéndolo o no) pueda recrear voz y entonación gracias a la IA podría hacerlo. La diferencia con DeepZen es la posibilidad de explotar una voz famosa.
En este sentido, otra compañía que trabaja con las voces del más allá es ElevenLabs, de la que hablamos de nuevo la semana pasada a raíz de su asociación con Spotify. Esta compañía tiene un entre su catálogo de voces de actores a algunos que pasaron a mejor vida, como James Dean, Judy Garland, Sir Laurence Olivier o Burt Reynolds.
Gracias a su app de lectura, toma artículos, PDFs, ePub, boletines informativos, o cualquier otro texto que reconozca en un smartphone y lo puede convertir en voces en off con cualquiera de estos actores mencionados. La compañía llegó a acuerdos con los responsables de los derechos de los actores cuyas voces se están utilizando, si bien no ha compartido detalles sobre la remuneración.
Como hemos señalado más arriba, la tecnología actual facilita que cualquiera pueda crear una versión de la voz de alguien que diga algo, incluso algo que nunca hubiera dicho. Se necesita muy poco para capturar el tono, los patrones de habla y otros elementos, ya sea de alguien famoso o una persona común. Y ese alguien puede estar vivo o muerto.
De hecho, la misma ElevenLabs fue noticia con anterioridad cuando, según parece, su herramienta se utilizó para crear una falsa llamada del ex presidente Joe Biden instando a la gente a no votar en las primarias presidenciales de New Hampshire. ChatGPT OpenAI también obtuvo muchas críticas después de presentar una voz sintética que era demasiado similar al personaje de Scarlett Johansson en la película Her.
Además, en agosto de 2024, se presentó una demanda colectiva contra ElevenLabs, acusada de utilizar las voces de los actores Karissa Vacker y Mark Boyett sin consentimiento para entrenar sus modelos de inteligencia artificial. Pero antes, en enero de 2024, de nuevo ElevenLabs causó revuelo al clonar también la voz de un fallecido, en este caso de Alain Dorval -la voz francesa de Silvester Stallone-, que fue eliminada después de que su familia protestara.
Al margen de las cuestiones de derechos, no está claro cómo las versiones de IA de voces conocidas que ya no están entre los vivos pueden ser recibidas por el público: curiosidad, morbo, indiferencia.
¿Alguna experiencia u opinión al respecto?