26 febrero 2026

Las licencias de IA se transforman en una pugna entre plataformas

Foto de Matheus Bertelli en Pexels

Foto de Matheus Bertelli en Pexels

Microsoft presentó la semana pasada su Mercado de Contenido para Editores (PCM), y Amazon tiene previsto sumarse con una propuesta similar estos días.

Ambos gigantes tecnológicos están creando espacios centralizados para gestionar la concesión de licencias de contenido editorial destinado al entrenamiento de sistemas de inteligencia artificial. Todo con la intención de reconducir años de conflictos por derechos de autor hacia acuerdos comerciales más estructurados.

El PCM de Microsoft fue desarrollado junto a destacados proveedores de contenido de Estados Unidos, entre ellos Associated Press, Condé Nast, Hearst Magazines, Vox Media y USA Today. En esta primera fase no participan editoriales de libros. En la plataforma, los editores fijan las condiciones de uso y licencia, mientras que los desarrolladores de IA pueden localizar y contratar contenidos para aplicaciones concretas.

Además, se prevén informes basados en el uso para ofrecer mayor transparencia sobre la explotación del material. En un inicio, el contenido abastecerá a Microsoft Copilot.

Mientras, Amazon Web Services anunciará su propio mercado de licencias de contenido para IA. Documentos de presentación difundidos antes de una conferencia de AWS sitúan esta iniciativa junto a productos clave como Bedrock y Quick Suite. Amazon, por su parte, ha evitado ofrecer demasiados detalles, aunque subraya sus relaciones históricas con el sector editorial.

Las propuestas de Microsoft y Amazon se insertan en un escenario más amplio en el que la industria de la IA intenta dar legitimidad a lo que el analista Thad McIlroy denomina el “pecado original” de la IA. Esto es, el uso sin autorización de materiales protegidos por derechos de autor para entrenar grandes modelos lingüísticos. Según McIlroy, las empresas tecnológicas han seguido una estrategia conocida: avanzar primero y resolver las cuestiones legales después, cuando su posición económica les permita negociar acuerdos.

Hasta ahora, la mayoría de los contratos de licencia se han concentrado en medios de comunicación. OpenAI, Microsoft, Amazon y Perplexity han alcanzado acuerdos con organizaciones como AP, The Financial Times, The New York Times, News Corp, Springer y The Atlantic.

En el ámbito editorial, la actividad ha sido mucho más limitada: Wiley destaca por su iniciativa, Taylor & Francis/Informa aparece varias veces en el seguimiento de Ithaka S+R, además de algunas editoriales universitarias y una comercial. Para McIlroy, la lista resulta sorprendentemente breve.

El sector está dividido sobre si las licencias representan una solución pragmática o una claudicación. Muchos autores perciben que las compañías de IA han traspasado límites inaceptables, especialmente tras revelarse el uso del corpus Book3 y la descarga de copias piratas procedentes de Library Genesis y Pirate Library Mirror para entrenar modelos relevantes.

Sin embargo, McIlroy advierte de otro riesgo. Este se refiere, una vez más, a poder quedar fuera del ecosistema digital emergente. Si un contenido no aparece en los resultados de Google, su visibilidad práctica es mínima. Algo similar podría suceder en un entorno donde las interacciones estén cada vez más mediadas por IA. No participar en acuerdos de licencia podría equivaler, en la práctica, a desaparecer.

McIlroy distingue entre el entrenamiento general de grandes modelos lingüísticos, donde los textos aportan capacidad estadística como “conjuntos de palabras”, y la generación aumentada por recuperación (RAG), centrada en consultar información específica. Para las editoriales, la RAG parece más prometedora, ya que el valor reside en el contenido concreto y en su atribución explícita.

En términos económicos, el panorama es poco alentador. Aunque se citó ampliamente una oferta de HarperCollins de 5.000 dólares por un libro infantil, se considera una excepción. En general, se habla de cifras cercanas a 100 dólares por libro, e incluso de tarifas de alrededor de 0,001 centavos por palabra en acuerdos masivos, lo que supondría unos 75 dólares por obra promedio. McIlroy calcula que el valor total de los acuerdos públicos conocidos ronda los 300 millones de dólares, una cantidad marginal frente a los enormes costes de entrenamiento de la IA.

Persiste, además, un problema estructural, y es que las empresas de IA buscan abarcar todos los ámbitos del conocimiento. En campos amplios, los datos ya recopilados pueden ser suficientes. En áreas muy especializadas -como el “teorema de no intercambio” en economía- sería necesario suscribir decenas de licencias específicas. Si la IA aspira a ofrecer autoridad real y no sólo apariencia de competencia, necesita acceso exhaustivo, incluidas numerosas bases de datos académicas que contienen información validada.

Esta incertidumbre ha impulsado la aparición de unos 30 intermediarios que intentan mediar entre titulares de derechos y compañías de IA, desde Copy Clearance Center hasta startups como Amlet, Cashmere y Created by Humans, así como servicios especializados como Wiley y Bookwire. Los nuevos mercados de Microsoft y Amazon compiten directamente con estos actores.

Siguen abiertas cuestiones esenciales. Por ejemplo, saber si funcionarán los contratos plurianuales si el contenido ya integrado en un modelo no puede retirarse, o si se impondrán los esquemas de pago basados en el uso, cada vez más defendidos por los editores. También habrá que dilucidar si logrará el sector acordar estándares comunes o continuará fragmentado, perdiendo capacidad de negociación.

Las iniciativas de Microsoft y Amazon podrían consolidarse como estándar de facto. Falta por ver si esto fortalecerá o debilitará la posición de las editoriales. Con la entrada directa de ambos gigantes tecnológicos, el mercado de licencias de contenido para IA entra en una nueva fase de competencia que podría dejar atrás a muchos intermediarios.

Para profundizar más, se puede acudir a texto original sobre licencias de Thad Mcllroy en este enlace. También hablaremos de estos asuntos en las próximas jornadas Parix sobre inteligencia artificial.

Leave a Reply