Meta demandada por infracción de derechos de autor para entrenar a su IA
Al parecer, los abogados de Meta Platforms (META.O) habrían advertido a la compañía sobre los peligros legales de utilizar miles de libros pirateados para entrenar sus modelos de IA.
Aún así, la compañía lo hizo de todos modos, según una presentación de demanda por infracción de derechos de autor.
La demanda se une a otras ya presentadas contra los propietarios de Facebook e Instagram por la comediante Sarah Silverman, el ganador del Premio Pulitzer Michael Chabon y otros autores, quienes alegan que Meta ha utilizado sus obras sin permiso para entrenar su modelo de lenguaje de inteligencia artificial.
La nueva denuncia, incluye registros de chat de un investigador afiliado a Meta que discute la adquisición del conjunto de datos en un servidor de Discord, una prueba potencialmente significativa que indica que Meta era consciente de que su uso de los libros puede no estar protegido por la ley de derechos de autor de Estados Unidos.
Si las demandas tienen éxito, estos y otros casos podrían frenar el uso de la IA generativa, ya que podrían aumentar el costo de construir modelos ávidos de datos al obligar a las empresas de IA a compensar a los artistas, autores y otros creadores de contenido por el uso de sus obras.
Al mismo tiempo, las nuevas normas provisionales en Europa que regulan la inteligencia artificial podrían obligar a las empresas a revelar los datos que utilizan para entrenar sus modelos, exponiéndolas potencialmente a más riesgos legales.
Asimismo, en una carta enviada a una investigación de la Cámara de los Lores del Reino Unido, OpenAI reconoció que era imposible entrenar inteligencias artificiales sin utilizar contenido protegido por derechos de autor.
Por su parte, Meta ha admitido haber dependido de libros «pirateados» para entrenar su IA. LO hizo utilizando partes del conjunto de datos Books3, entre muchos otros documentos, para entrenar Llama 1 y Llama 2.
No obstante, la multinacional afirma que «en la medida en que se considera necesaria una respuesta, niega que el uso de obras protegidas por derechos de autor para formar Llama”, por lo que no creen que tengan que dar ninguna compensación. Para ello se basa en la doctrina estadounidense del “fair use” y afirma así no haber infringido los derechos de autor de los demandantes.
La web The Eye eliminó todos los recursos de Books3 (utilizados por Meta) en agosto pasado, bajo presión de Rights Alliance. Esta biblioteca digital incluía obras de editoriales miembros de Rights Alliance: más de 30.000 libros de Penguin Random House y alrededor de 14.000 de HarperCollins, para un total de 196.640 referencias. Los datos de Books3 provendrían de Bibliotik, otra “biblioteca en la sombra” similar a Z-Library o Sci-Hub.
Veremos cómo se desarrollan las demandas y cómo pueden afectar las decisiones judiciales a la evolución de las inteligencias artificiales.