Uno de los casos más importantes de derechos de autor de AI pendientes en EE.UU., Thaler contra Perlmutter, tiene prevista su vista oral ante el Tribunal de Apelación del Circuito de Washington D.C. el mes que viene. Se trata de una apelación de un caso que el apelante, Stephen Thaler, perdió en el Tribunal de Distrito de EE.UU. para el Distrito de Columbia.
Espero los argumentos orales y la eventual decisión del Tribunal de Apelación con una combinación de resignación y temor, porque no se trata simplemente de un caso en el que unos hechos erróneos hacen una ley errónea, sino más bien de un caso en el que unos hechos desacertados y fácilmente evitables probablemente hacen una ley horrenda que distorsiona gravemente cuestiones críticas a la hora de evaluar la patentabilidad de las obras de arte asistidas por IA.
Thaler desarrolló un programa informático ambiciosamente llamado The Creativity Machine (La máquina de la creatividad), que podía transformar mensajes de texto en obras de arte visual utilizando diversos modelos y técnicas de IA. Se denegó el registro de una de esas obras, una pintura digital llamada "A Recent Entrance to Paradise" (Una entrada reciente al paraíso), alegando que su creación carecía del nivel necesario de participación humana para ser considerada un "escrito" protegible de un "autor", tal como se establece en la Constitución de los Estados Unidos y en la Ley de Propiedad Intelectual. La Oficina de Derechos de Autor se negó a registrar el cuadro porque carecía de autoría humana y, en cambio, como dijo el tribunal de distrito, el cuadro era una "obra generada de forma autónoma por un ordenador".
Cuando el caso llegó a los tribunales de distrito para la revisión de la denegación de la Oficina de Derechos de Autor, Thaler se dio cuenta de que se había condenado a sí mismo -y quizá al resto de los que utilizamos IA para la creación de imágenes- al insistir desde el principio en que la pintura había sido creada de forma independiente por "un algoritmo informático ejecutado en una máquina". Ante el tribunal, Thaler intentó dar marcha atrás, alegando que había "dado instrucciones y dirigido a su IA para crear la Obra" y que "la IA está totalmente controlada" por él. Sin embargo, estas declaraciones contradicen directamente el expediente administrativo de los procedimientos de la Oficina de Derechos de Autor y, de conformidad con el derecho administrativo bien establecido, no pudieron ser consideradas por el tribunal, que reprendió a Thaler por haber llegado "demasiado tarde" para adoptar una estrategia diferente.
Uno se pregunta si el ego o la ambición de Thaler, como desarrollador del software, le llevaron a exagerar la naturaleza "completamente autónoma" del software. Al hacerlo, creó una falsa narrativa que aseguró que su solicitud de derechos de autor fracasaría, preparando el escenario para la casi segura confirmación del tribunal de distrito por el Circuito DC, que nos dará una decisión a nivel de Circuito de que el arte de la IA no es susceptible de derechos de autor porque la contribución humana a la obra es demasiado menor e incidental.
Pero cualquiera que se haya adentrado mínimamente en la creación de arte con IA sabe que una obra de arte digital como ésta no es generada de forma autónoma por un ordenador. Parafraseando una nota a pie de página en la opinión del tribunal de distrito, si los no humanos autónomos y sensibles están haciendo valer sus derechos legales, nuestra sociedad tiene problemas mucho más importantes de los que ocuparse que los derechos de autor.
Del mismo modo, una cosa es ofrecer descripciones como las de los tribunales sobre el funcionamiento de la tecnología, que tienden a hacer hincapié en los aspectos no humanos del proceso, y otra muy distinta hablar de cómo es realmente utilizar el software.
Este extracto de una nota bien documentada en una edición de 2023 de la Houston Law Review es un buen ejemplo de lo primero:
Los generadores de arte de IA utilizan una combinación de algoritmos de aprendizaje profundo y aprendizaje automático para traducir las instrucciones de texto en imágenes. El texto se compara con enormes conjuntos de datos para determinar qué imágenes corresponden a los objetos o aspectos del texto. A continuación, el generador de IA utiliza varios algoritmos para deconstruir las imágenes seleccionadas y volver a ensamblarlas en algo que un ser humano pueda reconocer.
Cuando este tipo de descripciones del proceso de creación artística de la IA, aunque concisas y objetivamente precisas, son la base principal sobre la que los tribunales toman decisiones en materia de derechos de autor, el verdadero carácter de la dinámica entre el ser humano y la IA en la producción artística queda oscurecido, si no se pierde por completo. En el caso de Thaler, la culpa es de su estrategia jurídica, ya que obligó al tribunal de distrito a rechazar su solicitud en nombre de una IA supuestamente autónoma.
¿Un enfoque más matizado del arte asistido por IA? Algo así.
Si Thaler hubiera querido, podría haber actuado de otro modo. Por las razones que fueran, optó por declarar (erróneamente) ante la Oficina de Derechos de Autor que su Máquina Creativa era la única responsable de la pintura digital que pretendía proteger. En lugar de eso, podría haber intentado proteger sus propias contribuciones humanas al arte asistido por IA, como hizo Kristina Kashtanova con su cómic de 2022 Zarya of the Dawn.
Para ser justos, Kashtanova no reveló inicialmente que las ilustraciones de su cómic se habían realizado con Midjourney, una de las herramientas de inteligencia artificial generativa más populares y sofisticadas para convertir mensajes de texto en imágenes. De algún modo, la Oficina de Derechos de Autor "tuvo conocimiento de declaraciones en las redes sociales atribuidas a la Sra. Kashtanova en el sentido de que había creado el cómic utilizando la inteligencia artificial Midjourney". En respuesta, la Oficina de Derechos de Autor informó a Kashtanova de que su registro sería cancelado a menos que volviera a presentar su solicitud e identificara claramente los componentes de su obra creados trabajando con Midjourney.
En lugar de retractarse como Thaler, que siguió insistiendo en que su IA actuaba de forma autónoma hasta que fue demasiado tarde para modificar su estrategia, Kashtanova y su abogado presentaron una solicitud revisada en la que exponían qué elementos del cómic habían sido creados con la ayuda de la IA y cuáles no.
Kashtanova no sólo había concebido la idea del cómic y escrito su texto, sino que utilizó Midjourney como herramienta para crear las ilustraciones del cómic y diseñó los diseños de página que mostraban el texto y las imágenes combinados. La Oficina de Derechos de Autor no tuvo ningún problema en registrar el texto o la "selección, coordinación y disposición general del texto y los elementos visuales que componen la Obra".
Sin embargo, la Oficina de Derechos de Autor se negó a autorizar las imágenes creadas por Kashnatova con Midjourney, no porque ella renegara de su papel en el proceso, como había hecho Thaler, sino porque, según la Oficina de Derechos de Autor, Midjourney "genera imágenes de forma impredecible". Aun reconociendo el papel de Kashnatova en el proceso, admitiendo que "indicaciones adicionales... pueden influir en las imágenes subsiguientes", la Oficina de Derechos de Autor razonó que "el proceso no está controlado por el usuario porque no es posible predecir de antemano lo que Midjourney creará". Sobre esta base, la Oficina de Derechos de Autor concluyó bruscamente que "los usuarios de Midjourney no son "autores" a efectos de derechos de autor".
Ouch.
Todavía no he encontrado casos o artículos de revistas jurídicas que se centren en la "previsibilidad" como factor en el análisis de la originalidad. Lamentablemente, Kashtanova no recurrió, probablemente porque su segundo intento de registrar los derechos de autor de su cómic le brindó la oportunidad de subsanar lo que la Oficina de Derechos de Autor consideró una solicitud defectuosa por su falta de información sobre el uso de la IA, así como la posibilidad de obtener los derechos de autor sobre el cómic como título, como historia escrita y, lo que es más importante, como compilación que incluye el diseño de página y el uso de las ilustraciones como parte del diseño. No le iba a ir mejor llevando el asunto a apelación, pero el final de su procedimiento nos hace preguntarnos de dónde saca la Oficina de Derechos de Autor su formulación de que la creatividad humana es sinónimo de previsibilidad de los resultados del medio de expresión elegido.
En el objetivo
Esta postura absolutista se parece mucho a la forma en que los tribunales (y el público) reaccionaron ante la llegada de la fotografía a mediados del siglo XIX. Al principio, las cámaras se consideraban máquinas, productos de la ciencia y la tecnología. La noción del fotógrafo como un autor cuyos escritos tenían derecho a la protección de los derechos de autor era prácticamente inexistente durante las primeras décadas del camino de la fotografía hacia la ubicuidad cultural.
En lugar de considerar la cámara como un instrumento de un proceso creativo humano, muchos de los primeros comentaristas veían al ser humano como un operador auxiliar del proceso mecánico de una máquina. Un anuncio de la nueva cámara de Kodak para el mercado de masas de 1889 resume a la perfección esta visión de la fotografía como un proceso esencialmente autónomo. Junto a una imagen de la pequeña caja negra de un aparato se lee: "Usted pulsa el botón, nosotros hacemos el resto".
Quince años antes, en el caso de 1884 Burrow-Giles Lithographic Co. contra Sarony, el Tribunal Supremo de EE.UU. tuvo la oportunidad de responder a la pregunta de si "pulsar el botón" de una cámara era un acto lo suficientemente creativo y original como para constituir "autoría" a efectos de derechos de autor. En lugar de abordar la cuestión directamente, el Tribunal optó por localizar la creatividad humana requerida en los actos realizados antes de pulsar el botón. Más de 100 años después, los tribunales siguen haciendo lo mismo con regularidad, señalando "la selección por parte del fotógrafo del fondo, las luces, las sombras, la posición del sujeto y el momento", en un caso de un tribunal de distrito de 1998, y "las decisiones relativas a la iluminación, el equipo de cámara y el objetivo adecuados, los ajustes de la cámara y el uso del... fondo" en un caso del Undécimo Circuito de 2010.
Aunque en un principio los derechos de autor tuvieron problemas con la tecnología fotográfica y sólo consideraban arte original las fotografías más compuestas, la opinión predominante llegó a reflejar que las elecciones estéticas humanas impregnan un gran número de fotografías. Como escribió Susan Sontag, "[A] medida que la gente descubrió rápidamente que nadie hace la misma foto de la misma cosa, la suposición de que las cámaras proporcionan una imagen impersonal y objetiva cedió ante el hecho de que las fotografías son pruebas no sólo de lo que hay, sino de lo que ve un individuo". O, como afirmó nada menos que el juez Learned Hand, más de 40 años después de Sarony, "ninguna fotografía, por simple que sea, puede dejar de estar afectada por la influencia personal del autor, y no habrá dos absolutamente iguales."
La linterna mágica
Soy suscriptor de pago de Midjourney probablemente desde hace unos 18 meses, y he creado fácilmente al menos mil imágenes. Lo he utilizado para hacer pinturas digitales, dibujos, cómics, diseños de interfaz de usuario de sitios web y mucho más. La idea de que Midjourney no es una herramienta creativa, sino una inteligencia independiente que crea imágenes impredecibles sin intervención humana significativa, es tan errónea que nos lleva a preguntarnos si alguno de los jueces o funcionarios de la Oficina de Derechos de Autor que nos empujan por este camino ya trillado ha creado alguna vez una sola imagen con Midjourney o alguno de sus equivalentes.
Ofrezco las siguientes imágenes simplemente para demostrar que Midjourney puede ser una herramienta en manos de un artista cuya producción, incluso cuando se utiliza Midjourney con intención, lleva la impronta del artista y no puede razonablemente interpretarse simplemente como el resultado impredecible de un proceso autónomo al margen de cualquier participación humana no accidental.
Estas 2 primeras son obras tradicionales en técnica mixta que creé hace aproximadamente 10 años.
Estos dos segundos se crearon con Midjourney hace quizá un año.
Las dos últimas son obras tradicionales en técnica mixta creadas por mí este verano.
En lo que a mí respecta, y este es mi punto principal, en realidad, todas estas imágenes reflejan algo de mi visión artística, sea lo que sea exactamente, sin importar si las hice en mi terraza con pinturas y papeles y tijeras y pasteles, o sentado en la mesa de mi cocina delante de mi MacBook. Sostengo que los momentos de incertidumbre significativa ocurren todo el tiempo cuando se hace arte tradicional con materiales tradicionales. Cualquiera que conozca de pasada una tienda de arte habrá visto la asombrosa variedad de pinturas, geles, diluyentes, máscaras y otros productos a disposición de los pintores que trabajan con acrílicos, por poner sólo un ejemplo. Ha habido muchas noches en las que me he ido a la cama preguntándome qué aspecto tendría a la mañana siguiente la obra que estaba secándose en la terraza, ya que nunca antes había experimentado con ese método preciso y esa mezcla de materiales. En este sentido, se puede decir que Midjourney es una herramienta más predecible que un montón de materiales artísticos tradicionales, sobre todo a medida que aprendes la "sintaxis" de Midjourney y adquieres experiencia trabajando con ella como herramienta de expresión creativa.
Para crear una ilustración para esta entrada de blog, utilicé Midjourney. Como usuario habitual de Midjourney, abordé la tarea con una idea de la sensación que quería evocar y de cómo podría conseguirlo. Estas imágenes se ofrecen en un esfuerzo por capturar un poco de la experiencia de desarrollar una imagen con Midjourney para un propósito particular y con un aspecto y sensación particulares. Digo "un poco" porque crear una imagen que se adapte a mí como usuario humano a menudo requiere no sólo muchas iteraciones de las propias imágenes (a menudo, docenas), sino iteraciones que emplean diferentes niveles de zoom o que se basan en indicaciones de texto refinadas y en evolución, o que sólo alteran ciertas regiones de una imagen prescritas por el usuario.
Dicho esto, creo que la siguiente serie de imágenes extraídas de las muchas docenas de iteraciones implicadas en su creación insinúan, no obstante, un proceso creativo más matizado y complejo de lo que la Oficina de Derechos de Autor o los tribunales estadounidenses han reconocido hasta ahora.
La primera imagen es el conjunto inicial de 4 imágenes producidas por Midjourney en respuesta a la solicitud de texto del usuario, que he incluido aquí:
pintura moderna de colores con pintura húmeda, escritura y marcas aleatorias, que refleja el tema de que de las cámaras a la IA, la ley de derechos de autor debe evolucionar junto con la tecnología; sin símbolos de derechos de autor, balanzas de la justicia o robots -v 5.0
Los observadores astutos familiarizados con Midjourney se darán cuenta de que me he equivocado en la parte "no" de la pregunta, que, para que el software excluya correctamente ciertas ideas y métodos, necesita preceder la palabra "no" con dos guiones, como por ejemplo: "-no símbolos de derechos de autor, balanza de la justicia o robots". Este error humano es la razón por la que 2 de las 4 imágenes iniciales acaban incorporando balanzas de la justicia; también es una prueba más de que la IA no está haciendo nada de forma autónoma basándose en su propia inteligencia: está haciendo exactamente lo que yo le digo que haga, incluso cuando cometo un error en mis propias instrucciones.
Esta imagen es el resultado de una considerable iteración sobre la imagen original en la que aparece una cámara. Debo de haber probado al menos 20 variaciones sólo de la forma de la cámara y su objetivo.
La importancia de esta imagen estriba en que utiliza la función de "zoom" de Midjourney, que, como dispositivo creativo, es indistinguible de la capacidad de cambiar el objetivo de la cámara y acercar o alejar la imagen al tomar fotografías, uno de los aspectos de la fotografía más cacareados que expresan la creatividad humana y trascienden la mera pulsación de un botón.
Esta última imagen muestra algunas de las variaciones que condujeron a la imagen finalmente seleccionada para ser la "portada" o imagen principal que aparece al principio de este post. El motivo de incluir esta imagen no es tanto explorar los efectos del uso de un zoom virtual, sino ilustrar el momento en el que decidí, después de elegir una de las imágenes anteriores como portada, probar algo muy diferente sin ningún motivo en particular. La verdad es que, hasta que conozcamos a esos seres autónomos y sensibles, los humanos, especialmente los propensos a la expresión creativa espontánea, seremos las "máquinas" más imprevisibles de todas.