El auge de las herramientas de inteligencia artificial que aprovechan grandes cantidades de contenido de Internet ha comenzado a poner a prueba los límites de la ley de derechos de autor.
Los autores y una importante agencia de fotografía presentaron una demanda el año pasado, alegando que su propiedad intelectual se había utilizado ilegalmente para entrenar sistemas de inteligencia artificial, que pueden producir prosa similar a la humana y aplicaciones poderosas como los chatbots.
Ahora también han sido puestos en el foco de atención por la industria de las noticias. El New York Times presentó una demanda el miércoles acusando a OpenAI y Microsoft de infracción de derechos de autor, la primera impugnación de este tipo por parte de una importante organización de noticias estadounidense sobre el uso de inteligencia artificial.
La demanda afirma que ChatGPT de OpenAI y Bing Chat de Microsoft pueden producir contenido casi idéntico a los artículos del Times, lo que permite a las empresas «explotar libremente la inversión masiva del Times en su periodismo usándola para crear productos sustitutos sin permiso ni pago».
OpenAI y Microsoft no tuvieron la oportunidad de responder ante los tribunales. Pero después de que se presentó la demanda, esas empresas señalaron que estaban en conversaciones con varias organizaciones de noticias sobre el uso de su contenido y, en el caso de OpenAI, habían comenzado a firmar acuerdos.
Sin tales acuerdos, los límites podrían fijarse en los tribunales, con importantes repercusiones. Los datos son fundamentales para el desarrollo de tecnologías de inteligencia artificial generativa (que pueden generar texto, imágenes y otros medios por sí solas) y para los modelos de negocio de las empresas que realizan este trabajo.
«Los derechos de autor serán una de las cuestiones clave que darán forma a la industria de la IA generativa», dijo Fred Havemeyer, analista de la firma de investigación financiera Macquarie.
Una consideración central es la doctrina del “uso justo” en la ley de propiedad intelectual, que permite a los creadores aprovechar obras protegidas por derechos de autor. Entre otros factores, los demandados en casos de derechos de autor deben demostrar que han transformado sustancialmente el contenido y no están compitiendo en el mismo mercado como sustituto de la obra del creador original.
Una reseña que cita pasajes de un libro, por ejemplo, podría considerarse uso legítimo porque se basa en ese contenido para crear una obra nueva y única. Por otro lado, vender porciones extensas del libro puede violar la doctrina.
Los tribunales no han considerado cómo se aplican esos estándares a las herramientas de inteligencia artificial.
«No hay una respuesta clara sobre si esto es o no una infracción de derechos de autor o un uso legítimo en los Estados Unidos», dijo Ryan Abbott, abogado de Brown Neri Smith & Khan que maneja casos de propiedad intelectual. «Mientras tanto, tenemos muchas demandas en curso con potencialmente miles de millones de dólares en juego».
Puede que pase algún tiempo antes de que la industria obtenga respuestas definitivas.
Los juicios que plantean estas cuestiones se encuentran en las primeras etapas del litigio. Si no se llega a ningún acuerdo (como ocurre en la mayoría de los litigios), podrían pasar años antes de que un tribunal de distrito federal se pronuncie sobre el asunto. Es probable que esos fallos sean apelados, y las decisiones de apelación podrían variar según el circuito, lo que podría enviar el asunto a la Corte Suprema de Estados Unidos.
Llegar allí podría llevar unos diez años, dijo Abbott. “Una década es una eternidad en el mercado que vivimos actualmente”, afirmó.
El Times dijo en su demanda que había entablado negociaciones con Microsoft y OpenAI sobre los términos para resolver la disputa, posiblemente incluyendo una licencia. Associated Press y Axel Springer, el propietario alemán de publicaciones como Politico y Business Insider, llegaron recientemente a acuerdos de licencia de datos con OpenAI.
Llevar los casos a los tribunales podría responder preguntas vitales sobre qué datos protegidos por derechos de autor pueden utilizar los desarrolladores de IA y cómo. Pero también podría servir simplemente como palanca para que un demandante consiga un acuerdo de licencia más favorable mediante un acuerdo.
«En última instancia, si esta demanda termina o no dando forma a la ley de derechos de autor dependerá de si la demanda es realmente sobre el futuro del uso legítimo y los derechos de autor, o si es una salva en una negociación», dijo Jane Ginsburg, profesora de Derecho de Columbia. Escuela, dijo al Times sobre la demanda.
La evolución del panorama legal podría dar forma al naciente pero fuertemente capitalizado sector de la inteligencia artificial.
Algunas empresas de inteligencia artificial se vieron inundadas de capital de riesgo durante el año pasado después de que el lanzamiento público de ChatGPT se volviera viral. Un plan de acciones bajo consideración podría valorar OpenAI en más de 80 mil millones de dólares; Microsoft invirtió 13 mil millones de dólares en la empresa e incorporó su tecnología a sus productos. Pero las preguntas sobre el uso de la propiedad intelectual para entrenar modelos han sido preocupaciones importantes entre los inversores, dijo Havemeyer.
La competencia en el campo de la inteligencia artificial puede reducirse entre los que tienen y los que no tienen datos.
Las empresas con derechos sobre grandes cantidades de datos, como Adobe y Bloomberg –o que han acumulado sus propios datos, como Meta y Google– han comenzado a desarrollar sus propias herramientas de inteligencia artificial. Havemeyer señaló que una empresa establecida como Microsoft estaba bien equipada para asegurar acuerdos de licencia de datos y enfrentar desafíos legales. Pero las empresas emergentes con menos capital pueden tener dificultades para obtener los datos que necesitan para competir.
«La IA generativa comienza y termina con los datos», dijo Havemeyer.
Benjamín Mullin contribuyó al reportaje.