La Enciclopedia Britannica y el diccionario Merriam‑Webster han presentado una demanda contra OpenAI, alegando que la empresa usó su contenido protegido por derechos de autor para entrenar sus modelos de inteligencia artificial y que esos modelos, especialmente GPT‑4, devuelven fragmentos muy parecidos a los textos originales.

Qué dice la demanda

Según la demanda presentada el viernes, Britannica sostiene que OpenAI copió repetidamente su contenido sin permiso. En palabras citadas del documento, GPT‑4 habría "memorizado" gran parte del contenido con derechos de autor de Britannica y puede generar copias casi literales de pasajes significativos cuando se le solicita.

El documento incorpora ejemplos en los que las respuestas generadas por los modelos aparecen lado a lado con textos de Britannica, y en varios casos las coincidencias son prácticamente palabra por palabra.

Reclamo adicional: canibalización del tráfico web

Britannica también afirma que OpenAI está “canibalizando” su tráfico en la web. Es decir, cuando los usuarios preguntan algo, el modelo entrega una respuesta que sustituye o compite directamente con el contenido original de Britannica en lugar de dirigir a los usuarios al sitio de la enciclopedia, como haría un motor de búsqueda tradicional.

No es un caso aislado

Esta demanda se suma a otras disputas legales entre editores y empresas de IA. El The New York Times tiene una demanda en curso con alegaciones parecidas sobre el uso masivo de su contenido. Además, en septiembre, la compañía Anthropic acordó pagar 1.500 millones de dólares en una demanda colectiva por usar libros con derechos de autor para entrenar sus modelos.

Por qué importa esto

  • Para las editoriales: plantea si las empresas de IA deben pagar o pedir permiso para usar materiales con derechos de autor en el entrenamiento.
  • Para los desarrolladores de IA: obliga a replantear prácticas de recopilación de datos y límites en la reproducción literal de textos.
  • Para los usuarios: afecta la forma en que obtenemos información y qué fuentes se benefician cuando consultamos un asistente virtual.

En resumen, la demanda de Britannica y Merriam‑Webster vuelve a poner sobre la mesa una pregunta práctica: ¿hasta qué punto puede una IA aprender de contenido protegido sin copiarlo de forma inapropiada? La respuesta legal y técnica todavía está en proceso, pero el caso añade más presión a un debate que ya era intenso.