400-periodicos-de-eeuu-exigen-ante-la-justicia-desmontar-chatgp
400-periodicos-de-eeuu-exigen-ante-la-justicia-desmontar-chatgp

Más de 400 periódicos de EEUU exigen desmontar ChatGPT ante la justicia

Más de 400 periódicos de Estados Unidos reclaman en los tribunales una orden judicial que obligue a OpenAI y Microsoft a «eliminar todas las copias de las obras registradas de todos los modelos ChatGPT y otros modelos de lenguaje de gran tamaño, así como de todos los conjuntos de entrenamiento».

Si un juez federal dictaminase que los cimientos de ChatGPT se construyeron con materiales robados, el edificio entero de la IA generativa actual podría verse obligado a demolerse para volver a empezar desde cero, respetando esta vez las reglas del juego. Lo que se debate en los tribunales no es el freno al progreso tecnológico, sino una pregunta fundamental para la supervivencia de la cultura y la información: ¿Tiene derecho el progreso técnico a financiarse mediante el saqueo y la destrucción económica de quienes crean el conocimiento?.

Una industria que ha crecido a la sombra del despojo

La gravedad de este asunto, planteado formalmente el pasado 24 de junio de 2026 ante el Tribunal del Distrito Sur de Nueva York, ha expuesto las costuras de una industria que ha crecido a la sombra del despojo. Un frente unido de 36 grupos editoriales, en representación de cerca de 400 periódicos locales y regionales de Estados Unidos, ha dicho basta. Cabeceras con más de un siglo de historia como The New York Amsterdam News, el Arkansas Democrat-Gazette o el Long Island Herald han decidido plantar cara a los dos gigantes más poderosos de Silicon Valley: OpenAI y Microsoft.

Pero este litigio trasciende las fronteras norteamericanas y el formato de los grandes rotativos. La demanda describe con precisión forense un modelo de extracción de datos que estrangula, con idéntica fuerza, a la base de la pirámide informativa global: miles de pequeños diarios digitales, blogs especializados construidos sobre WordPress, como el portal de referencia Observatorio Blockchain, y legiones de creadores de contenido independientes que hoy descubren cómo el fruto de años de trabajo ha sido devorado para alimentar un negocio ajeno. Sin su permiso, y sin recibir un solo céntimo a cambio.

La ingeniería del expolio

Uno de los pilares más alarmantes del texto jurídico radica en la demostración de que este vaciado de información no fue accidental, sino una decisión empresarial consciente y planificada. Según los demandantes, OpenAI implementó herramientas de software automatizadas denominadas Dragnet y Newspaper con el propósito de despojar sistemáticamente a los artículos de su Copyright Management Information (CMI).

A través de esta maniobra técnica, los algoritmos separaron el cuerpo del texto de cualquier rastro que delatara su autoría original, eliminando de forma deliberada los ombres de los periodistas y reporteros de investigación, lostTítulos de las obras y avisos explícitos de copyright y las narcas editoriales y condiciones de uso legal.

Al quitarle las etiquetas a la mercancía, las tecnológicas introdujeron los textos en sus servidores ocultando su procedencia. Las pruebas técnicas aportadas por los expertos en la demanda son demoledoras. El conjunto de datos C4, derivado del rastreo masivo de Common Crawl, albergaba más de 115 millones de tokens pertenecientes a los medios afectados, mientras que firmas como Ogden Newspapers acumulaban más de 71 millones de tokens en el corpus de entrenamiento.

Palabras idénticas de textos protegidos por derechos de autor

La consecuencia directa es el fenómeno de la memorización, ya que los modelos basados en GPT no solo aprenden estructuras gramaticales, sino que retienen fragmentos literales de las crónicas. El escrito judicial constata que, ante los comandos (prompts) adecuados, ChatGPT es capaz de reproducir cientos de palabras idénticas de textos protegidos por derechos de autor, evidenciando un plagio automatizado a escala industrial.

El trasfondo socioeconómico de la demanda revela una asimetría obscena. En marzo de 2026, la valoración de OpenAI ascendió a 852.000 millones de dólares, sustentada sobre una facturación mensual de 2.000 millones de dólares y una masa crítica de 900 millones de usuarios semanales. Microsoft, lejos de actuar como un mero inversor financiero, aparece como el coarquitecto necesario. La compañía ha inyectado 13.000 millones de dólares y diseñado la infraestructura informática de supercomputación indispensable para procesar los contenidos robados e integrarlos en productos comerciales como Copilot y Bing Chat.

En la otra orilla de esta brecha económica se sitúa el periodismo de proximidad, una estructura civil que sostiene la rendición de cuentas en las comunidades locales. Los medios demandantes emplean a miles de trabajadores para cubrir la información diaria que ninguna inteligencia artificial sale a buscar a la calle.  Plenos municipales, elecciones locales, juntas escolares, casos de corrupción en los ayuntamientos, presupuestos vecinales, sucesos, empleo y economía de cercanía.

El rconocimiento del propio Sam Altman

Silicon Valley optó por externalizar los costes de la investigación y la redacción hacia los editores y los creadores para quedarse, en exclusiva, con el beneficio de la respuesta automatizada. El propio CEO de OpenAI, Sam Altman, concedió la razón a los demandantes al declarar ante la Cámara de los Lores británica que «sería imposible entrenar los principales modelos de IA actuales sin utilizar materiales protegidos por derechos de autor». Es decir, admiten la necesidad absoluta de la materia prima, pero se niegan a pagar la factura.

El impacto de este modelo extractivo altera la línea de flotación de toda la web abierta. Durante más de dos décadas, internet ha funcionado bajo un pacto implícito en el que los creadores independientes, los analistas y los periodistas publicaban su conocimiento en la red a cambio de la posibilidad de recibir tráfico directo, visibilidad, suscripciones o ingresos publicitarios que hicieran sostenible su actividad.

La irrupción de la IA generativa ha roto unilateralmente ese ecosistema. Al desviar el tráfico, el usuario consume la información resumida en la interfaz de la IA sin llegar jamás a pinchar en la web de origen. Al monopolizar la publicidad digital, las grandes tecnológicas están secando el pozo del que se nutren.

La responsabilidad del Tribunal

Si redactar un análisis técnico profundo en un sitio en WordPress o destapar una trama de corrupción municipal exige semanas o meses de esfuerzo y recursos económicos, pero un algoritmo se apropia de la pieza a los cinco minutos de su publicación para revenderla en un chat, la producción de contenido original se convierte en un ejercicio inviable. El Tribunal del Distrito Sur de Nueva York no solo tiene en sus manos la resolución de un litigio millonario sobre propiedad intelectual; tiene la responsabilidad histórica de decidir si el futuro de la información pertenecerá a la creación legítima o al saqueo impune.

Comparte esto: