10 enero 2024

El New York Times demanda a OpenAI y Microsoft

Imagen de ThankYouFantasyPictures en Pixabay

Imagen de ThankYouFantasyPictures en Pixabay

El New York Times ha demandado a OpenAI y Microsoft por infracción de derechos de autor.

Para ello ha alegado que la tecnología de IA de tales empresas copió ilegalmente millones de artículos del Times para capacitar a ChatGPT y otros servicios para brindar acceso instantáneo a la información, tecnología que, además, ahora compite con el Times.

La denuncia es la última de una serie de demandas que buscan limitar el uso del supuesto scraping de amplias franjas de contenido de Internet sin compensación alguna para entrenar los llamados modelos de IA de lenguaje.

Ya vimos como actores, guionistas, escritores y periodistas que publican sus trabajos en Internet temen que la IA aprenda de su material y proporcione chatbots competitivos y otras fuentes de información sin una compensación adecuada.

La demanda del Times es la primera entre los principales editores de noticias que se enfrenta a OpenAI y Microsoft. Con la denuncia el Times señala que tiene el deber de informar a sus suscriptores, pero el “uso ilegal del trabajo del Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con él amenaza la capacidad del Times para brindar ese servicio”.

La denuncia señala que OpenAI y Microsoft utilizaron otras fuentes en su “copia a gran escala”, pero “le dieron al Times un énfasis particular en el contenido” buscando “aprovechar la inversión masiva del Times en su periodismo usándolo para crear productos sustitutos sin permiso o pago.»

Por su parte, OpenAI afirma que respetan los derechos de los creadores y propietarios de contenidos y están comprometidos a trabajar con ellos para garantizar que se beneficien de la tecnología de IA y de los nuevos modelos de ingresos.

De hecho, hace unos meses los periódicos más importantes (entre ellos el propio Times) comenzaron una negociación al querer pagos por los artículos utilizados para impulsar el ChatGPT. Durante años, empresas de tecnología como Open AI han utilizado libremente noticias para crear conjuntos de datos que enseñan a sus máquinas cómo reconocer y responder con fluidez a las consultas humanas sobre diversos temas del mundo.

A medida que la búsqueda para desarrollar modelos de IA de vanguardia se ha vuelto cada vez más frenética, los editores de periódicos y otros propietarios de datos exigen una parte del mercado potencialmente masivo de la IA generativa, que se prevé que alcance los 1,3 billones de dólares en 2032, según Bloomberg Intelligence.

Las discusiones se centraban en pagar a los editores para que el chatbot pueda mostrar enlaces a noticias individuales en sus respuestas, un desarrollo que beneficiaría a los periódicos de dos maneras: proporcionando pago directo y potencialmente aumentando el tráfico a sus sitios web. (Actualización: en estos momentos OpenAI ha ofrecido a algunas empresas de medios entre 1 y 5 millones de dólares al año para licenciar sus artículos de noticias para usarlos en el entrenamiento de sus grandes modelos de lenguaje, según dos ejecutivos que recientemente negociaron con la compañía de tecnología.)

En julio, Open AI llegó a un acuerdo para licenciar contenido de Associated Press como datos de entrenamiento para sus modelos de IA. Un portavoz de OpenAI confirmó que la compañía está en conversaciones con los periódicos y que las discusiones no se centraron en datos de capacitación anteriores, que, según afirma, se obtuvieron legalmente.

El Times alega que no ha podido llegar a una resolución con las empresas denunciadas. Microsoft y OpenAI afirman que las obras del Times se consideran de «uso justo», lo que les da la posibilidad de utilizar material protegido por derechos de autor con un «propósito transformador», afirma la denuncia.

El Times se opuso firmemente a esa afirmación, diciendo que ChatGPT y el chatbot Bing de Microsoft (también conocido como “copilot”) pueden proporcionar un servicio similar al del New York Times.

En su demanda, el Times alega que los conjuntos de datos utilizados para entrenar los grandes modelos de lenguaje OpenAI más recientes, que impulsan sus herramientas de inteligencia artificial, «probablemente utilizaron millones de obras propiedad del Times».

La demanda del Times podría sentar un precedente para la industria en general, ya que la cuestión de si el uso de material protegido por derechos de autor para entrenar modelos de IA viola la ley es aún un asunto legal pendiente.

Leave a Reply