Más allá de la regurgitación: El uso justo transformador en la formación de la IA

IA y uso legítimo

Cuando el New York Times demandó a OpenAI, la acusación que acaparó más titulares se refería a que ChatGPT a veces producía, como salida para el usuario, todo o sustancialmente todo un artículo real publicado previamente por el Times. Se ha informado ampliamente de que OpenAI acusa al Times de instigar deliberadamente a GPT a "regurgitar"los artículos del Times "manipulando" los mensajes de mala fe, o incluso de dirigir a GPT para que infrinja los derechos de autor del propio Times.

La copia y distribución no autorizada al por mayor de obras literarias protegidas por derechos de autor a sus propios usuarios de pago es obviamente un uso infractor, siempre. Esto es tan cierto en 2024 con la IA como lo fue casi 200 años antes, cuando el consumado representante de EE.UU. por Massachusetts, el reverendo Charles Wentworth Upton, incluyó 353 páginas de cartas previamente publicadas escritas por George Washington en la propia obra del reverendo, de casi 900 páginas y dos volúmenes, lo que le llevó a perder lo que se considera el primer caso de "uso justo " en el Tribunal Supremo de EE.UU.

En cuanto al fondo y la importancia del caso del Times (y de otros similares, incluidos los que afectan a fotografías y otras artes visuales), este enfoque limitado a la "regurgitación" por parte de la IA de copias completas de obras protegidas por derechos de autor es una pista falsa que nos distrae de cuestiones más matizadas e importantes, como el uso legítimo de material protegido por derechos de autor para entrenar modelos de IA y si las obras expresivas realizadas por o con IA pueden estar protegidas por derechos de autor en primera instancia.

Apetito de instrucción

Los modelos de entrenamiento y prueba de IA tienen un apetito por el contenido tan voraz como un dragón de Poniente que aterriza en un pasto lleno de ovejas después de una gran batalla. Incluso cuando los proveedores del modelo son capaces de llegar a acuerdos como OpenAI ha hecho con los gustos de Reddit y la revista Time para licenciar material con derechos de autor como insumos de entrenamiento (discutido en detalle en la Parte I de este post), el gran volumen de datos necesarios para entrenar los modelos hace que sea prohibitivo hacer acuerdos de licencia con todos los miles si no millones de titulares de derechos de autor cuyo contenido en línea podría ser utilizado para entrenar la IA, probablemente sin su conocimiento o consentimiento.

Establecido en la Sección 107 de la Ley de Derechos de Autor, el uso justo es una doctrina de la ley de derechos de autor de EE.UU. que permite el uso limitado de material protegido por derechos de autor sin permiso bajo ciertas condiciones. Los factores que determinan el uso legítimo son (1) el propósito y el carácter del uso, incluyendo si es de naturaleza comercial o para fines educativos sin ánimo de lucro; (2) la naturaleza de la obra protegida por derechos de autor; (3) la cantidad y sustancialidad de la parte utilizada en relación con la obra protegida por derechos de autor en su conjunto; y (4) el efecto del uso sobre el mercado potencial o el valor de la obra protegida por derechos de autor.

Uso transformador de obras creativas

En Fundación Andy Warhol para las Artes Visuales, Inc. contra Goldsmithresuelto por el Tribunal Supremo en 2023, la conocida fotógrafa Lynn Goldsmith demandó a la Fundación Andy Warhol por infracción de derechos de autor. Warhol había producido una serie de obras de arte serigrafiadas basadas en la foto de Prince con derechos de autor de Goldsmith, que presentaban cambios en la composición y la paleta de colores. Una de estas obras, "Orange Prince", acabó en la portada de Vanity Fair sin ninguna atribución ni compensación para Goldsmith.

Sólo el primer factor estuvo ante el Tribunal Supremo, que falló a favor de Goldsmith, sosteniendo que "Orange Prince" era un uso comercial de la obra protegida por derechos de autor con un "propósito y carácter" insuficientemente "transformado" del original para constituir un uso legítimo.

El uso "transformador" no se menciona en ninguna parte de la definición de uso legítimo; sin embargo, se ha convertido en la piedra de toque de la jurisprudencia contemporánea sobre uso legítimo y es probable que esté en el centro de las eventuales opiniones de los tribunales que surjan de los casos de uso legítimo centrados en la IA.

El Tribunal consideró que "Orange Prince" no era lo suficientemente transformadora como para constituir un uso legítimo porque Warhol creó básicamente un "sustituto comercial" compuesto por partes sustanciales de la foto original, para su uso en el mismo mercado que el original y esencialmente con el mismo fin. Por el contrario, según el Tribunal, obras como la versión de 2 Live Crew de "Pretty Woman" de Roy Orbison (objeto de un caso de uso legítimo en 1994) y los icónicos cuadros de latas de sopa del propio Warhol eran suficientemente transformadores para constituir un uso legítimo. En el primer caso, porque la versión que el grupo de rap hizo de la canción era lo bastante paródica como para crear una obra nueva basada en la crítica o el comentario del original, y en el segundo, porque los cuadros tienen "una finalidad completamente distinta, comentar el consumismo en lugar de anunciar sopa".

Uso transformador basado en aspectos no expresivos

La decisión sobre Warhol se produce tras la incursión del Tribunal Supremo en el uso legítimo dos años antes en el caso Google LLC contra Oracle America, Inc.que se refería al "uso no expresivo" y no al uso "creativo" o "expresivo" en cuestión en el caso Warhol. Oracle demandó a Google por infracción basándose en el uso por parte de Google de más de 11.000 líneas de código de la API Java de Oracle para desarrollar el sistema operativo Android. El Tribunal Supremo sostuvo que, al crear una nueva plataforma para dispositivos móviles, Google había reutilizado suficientemente la API de Java, diseñada originalmente para aplicaciones de escritorio, para constituir un uso leal transformacional.

Quizás el más revelador de los casos de mayor repercusión sobre el uso justo transformativo, en términos de lo que dice sobre la futura legalidad de los productos basados en IA como ChatGPT, es otro caso anterior de Google resuelto en el Segundo Circuito en 1997. En Authors Guild contra Googleel tribunal consideró que la digitalización por parte de Google de millones de libros para crear una base de datos en la que se pudieran realizar búsquedas constituía un uso legítimo transformador en la medida en que ofrecía acceso a funciones como la minería de datos y las búsquedas exhaustivas de texto, que eran fundamentalmente diferentes de la simple lectura de un libro y que posiblemente podrían ampliar el mercado de los libros de la base de datos.

Cómo entrenar a tu dragón de inteligencia artificial

Cuando se entrena IA, el uso de obras protegidas por derechos de autor para desarrollar nuevas funcionalidades o aplicaciones puede considerarse transformativo si la IA crea algo significativamente nuevo y diferente. Sin embargo, si la IA se limita a replicar o realizar modificaciones menores en las obras originales sin añadir un nuevo significado o valor sustancial, es poco probable que se considere transformadora.

Por lo general, los tribunales son más reacios a declarar el uso legítimo cuando las obras originales son muy creativas. Para que se aplique el uso leal, el producto de IA resultante debe utilizar las obras creativas originales de un modo que sea claramente diferente, añada un nuevo valor o utilidad y no afecte negativamente al mercado de las obras originales.