Thaler 诉 Perlmutter 案是美国悬而未决的人工智能版权案中较为重要的案件之一,计划于下月在哥伦比亚特区巡回上诉法院进行口头辩论。这是上诉人斯蒂芬-塔勒(Stephen Thaler)在美国哥伦比亚特区地方法院败诉后提起的上诉。
我怀着既不甘心又低度恐惧的心情等待着口头辩论和上诉法院的最终裁决,因为这不仅仅是一个由糟糕的事实造就糟糕的法律的案例,而是一个不明智的、很容易避免的事实很可能造就可怕的法律的案例,严重扭曲了评估人工智能辅助艺术作品版权性的关键问题。
Thaler 开发了一款软件,雄心勃勃地命名为 "创造力机器",它可以利用各种人工智能模型和技术将文字提示转化为视觉艺术作品。其中一幅名为 "A Recent Entrance to Paradise "的数字绘画作品被拒绝注册,理由是根据《美国宪法》和《版权法》的规定,该作品的创作缺乏必要的人工参与,不能被视为 "作者 "的 "创作"。版权局拒绝注册这幅画,因为它缺乏人类作者的身份,而正如地区法院所说,这幅画是 "计算机自主生成的作品"。
当地方法院对版权局的驳回进行复审时,Thaler 意识到,他从一开始就坚持认为这幅画是由 "在机器上运行的计算机算法 "独立创作的,这注定了他自己的命运,也许也注定了我们其他使用人工智能进行图像创作的人的命运。在法庭上,Thaler 试图反其道而行之,辩称他 "提供了指令,并指示他的人工智能创作作品",而且 "人工智能完全由他控制"。然而,这些说法与版权局诉讼程序中的行政记录直接矛盾,根据公认的行政法,法院不能予以考虑,并责备 Thaler "太晚 "采取不同的策略。
我们不禁要问,作为软件的开发者,Thaler 是出于自负还是野心,将自己引向了夸大软件 "完全自主 "性质的方向。这样做造成了一种虚假的说法,确保他的版权申请会失败,为华盛顿巡回法院几乎肯定地维持地区法院的判决创造了条件,这将给我们一个巡回法院级别的判决,即人工智能艺术不可受版权保护,因为人类对作品的贡献太微不足道了。
但凡稍微涉猎过人工智能艺术创作的人都知道,这样的数字艺术作品并不是由计算机自主生成的。套用地方法院意见书脚注中的一句话:如果有知觉的、自主的非人类都在主张自己的合法权利,那么我们的社会就有比版权更大的问题需要解决了。
同样,像法院那样描述技术的功能是一回事,往往会强调过程中的非人类方面,而谈论使用软件的真实感受则完全是另一回事。
这篇摘自 2023 年版《休斯顿法律评论》上一篇经过深入研究的说明的文章就是前者的一个很好的例子:
人工智能艺术生成器结合使用深度学习和机器学习算法,将文本提示翻译成图像。提供的提示会与大量数据集进行比较,以确定哪些图像与提示中的对象或方面相对应。然后,人工智能生成器会使用多种算法来解构它所选择的图像,将它们重新组合成人类可以识别的图像。
对人工智能艺术创作过程的描述虽然简明扼要、事实准确,但当法院据此做出版权判决时,人类与人工智能在艺术创作过程中的动态的真实特征就会被掩盖,甚至完全丧失。在 Thaler 案中,他的法律策略难辞其咎,因为他迫使地方法院驳回了他代表所谓自主人工智能提出的申请。
人工智能辅助艺术更细致入微?算是吧
如果泰勒愿意,他本可以采取不同的策略。不管出于什么原因,他选择(错误地)向版权局陈述,他的创造机器是他想要保护的数字绘画的唯一责任人。相反,他本可以像克里斯蒂娜-卡什塔诺娃(Kristina Kashtanova)在其 2022 年出版的漫画书《黎明的扎里亚》(Zarya of the Dawn)中所做的那样,尝试为自己对人工智能辅助艺术的人类贡献申请版权。
公平地说,卡什塔诺娃最初并没有透露她漫画中的插图是使用 Midjourney 制作的,而 Midjourney 是将文字提示转化为图像的最流行、最复杂的生成式人工智能工具之一。版权局不知何故 "注意到社交媒体上有一些归功于卡什塔诺娃女士的声明,称她使用 Midjourney 人工智能创作了这本漫画书"。对此,版权局通知卡什塔诺娃,除非她重新提交申请,并明确指出其作品中使用 Midjourney 创作的部分,否则其注册将被取消。
卡什塔诺娃和她的律师并没有像塔勒那样继续坚持他的人工智能是自主行动的,直到改变策略为时已晚,而是提交了一份修改后的申请,说明漫画中哪些元素是在人工智能的协助下创作的,哪些不是。
卡什塔诺娃不仅构思了漫画的构思并撰写了文字,还利用《Midjourney》作为工具创作了漫画插图,并设计了显示文字和图像组合的页面布局。版权局对文字或 "构成作品的文字和视觉元素的整体选择、协调和安排 "没有异议。
然而,版权局拒绝为卡什纳托娃用 Midjourney 创造的图像授予版权--不是因为她像 Thaler 一样否认了自己在这一过程中的作用,而是因为,正如版权局所说,Midjourney "以一种不可预测的方式生成图像"。即使版权局承认 Kashnatova 在这一过程中的作用,承认 "额外的提示......可以影响随后的图像",但版权局的理由是 "这一过程不受用户控制,因为不可能提前预测 Midjourney 将生成什么"。正是基于这一点,版权局粗暴地得出结论:"就版权而言,Midjourney 的用户不是'作者'"。
哎哟
我还从未见过将 "可预测性 "作为原创性分析因素的案例或法律评论文章。遗憾的是,卡什塔诺娃没有提出上诉,这很可能是因为她第二次申请漫画版权时,版权局认为她的申请存在缺陷,没有披露人工智能的使用情况,因此她有机会弥补这一缺陷,并且能够获得漫画作为标题、作为书面故事以及最重要的是作为包括页面布局和作为设计一部分的插图在内的汇编作品的版权。她在上诉中的表现不会更好,但她诉讼的结局让我们不禁要问,版权局是从哪里得出人类创造力与所选表达媒介结果的可预测性是同义词这一说法的。
进入镜头
这种专制主义立场与十九世纪中叶摄影术出现时法院(和公众)的反应非常相似。照相机最初被普遍视为机器,是科学技术的产物。在摄影走向文化普及的最初几十年里,摄影师作为作者,其作品有权获得版权保护的概念基本不存在。
许多早期的评论家并没有将照相机视为人类创造过程中的工具,而是将人类视为机器机械过程的辅助操作者。柯达公司 1889 年推出的一款新型大众相机的广告最能概括这种观点,即摄影本质上是一个自主的过程。在小黑盒子设备的图片旁,有这样一句话:"您按下按钮,剩下的交给我们"。
15 年前,在 1884 年的Burrow-Giles Lithographic Co. v. Sarony 案中,美国最高法院曾有机会回答这样一个问题:"按下照相机上的按钮 "是否具有足够的创造性和独创性,从而构成版权意义上的 "作者身份"。法院没有直接解决这个问题,而是选择在按下按钮之前的行为中寻找必要的人类创造力。100 多年后,法院仍然经常做同样的事情,在 1998 年的一个地区法院案件中,法院指出 "摄影师对背景、灯光、阴影、主体位置和时间的选择";在 2010 年的一个第十一巡回法院案件中,法院指出 "关于照明、适当的照相设备和镜头、相机设置和使用......背景的决定"。
尽管版权最初在摄影技术方面遇到困难,最初只将最有构图的照片视为原创艺术,但后来的普遍观点反映出,人类的审美选择渗透到大量照片中。正如苏珊-桑塔格(Susan Sontag)所写:"人们很快就发现,没有人会对同样的事物拍摄同样的照片,照相机提供的是非个人的客观图像的假设让位于这样一个事实,即照片不仅是存在的事物的证据,也是个人所见的事物的证据。或者说,在萨罗尼事件 40 多年后,不亚于法律权威的里恩德-汉德法官指出,"任何照片,无论多么简单,都不可能不受作者个人影响,没有两张照片是绝对相同的"。
魔灯
我成为Midjourney的付费用户大概有 18 个月了,我已经轻松制作了至少上千张图片。我用它制作过数字绘画、素描、漫画、网站用户界面设计等等。有人认为 Midjourney 不是一种创作工具,而是一种独立的智能,在没有人为干预的情况下创造出不可预知的图像,这种观点是错误的,让人不禁要问,在推动我们走上这条老路的法官或版权局工作人员中,是否有人曾经用 Midjourney 或其同类产品创造过一幅图像。
我提供以下图片只是为了说明,Midjourney 可以成为艺术家手中的工具,而艺术家的作品,包括有意使用 Midjourney 时的作品,都会给人留下艺术家的印象,而不能被合理地理解为脱离任何非偶然的人为参与的自主过程的不可预知的结果。
前两幅是我大约 10 年前创作的传统混合媒介作品。
后两幅作品是一年前与 Midjourney 一起创作的。
最后两幅是我今年夏天创作的传统混合媒介作品。
就我而言,这是我的主要观点,实际上,所有这些图像都反映了我的一些艺术构想,不管那到底是什么,也不管我是在露台上用颜料、纸张、剪刀和粉彩画出来的,还是坐在厨房的餐桌前对着 MacBook 画出来的。我认为,在使用传统材料创作传统艺术作品的过程中,经常会出现重大的不确定性。任何一个熟悉艺术品商店的人都会看到琳琅满目的颜料、凝胶、稀释剂、遮罩和其他产品,这些都是为使用丙烯颜料的画家提供的。有很多个晚上,我睡觉前都在想,第二天早上晾晒在甲板上的作品会是什么样子,因为我以前从未尝试过这种精确的方法和混合材料。从这个意义上说,Midjourney 可以说是比一车传统艺术用品更容易预测的工具,尤其是当你学会了Midjourney 的 "语法",并积累了使用它作为创造性表达工具的经验之后。
为了创作这篇博文的插图,我使用了 Midjourney。作为 Midjourney 的习惯用户,我在完成这项任务时已经想好了要表达的感觉,以及如何达到这一目的。提供这些图片的目的是为了捕捉用 Midjourney 制作图片的一些经验,以达到特定的目的和特定的外观和感觉。我之所以说 "一些",是因为创建一个适合我这个人类用户的图像,往往不仅需要对图像本身进行多次重复(通常是几十次),而且还需要采用不同的缩放级别,或根据不断变化、不断完善的文本提示,或只改变图像中用户指定的某些区域。
尽管如此,我认为下面这组从几十次反复创作中节选出来的图片,还是暗示了一个比版权局或美国法院之前所承认的更细微、更复杂的创作过程。
第一张图片是 Midjourney 根据用户的文字提示制作的最初 4 张图片集,我在此将其收录其中:
用湿颜料绘制的现代色彩画,随意书写和标记,反映了从相机到人工智能,版权法必须与技术同步发展的主题;没有版权符号、正义的天平或机器人 -v 5.0
熟悉《Midjourney》的敏锐观察者会发现,我弄错了提示中的 "不 "字,为了让软件正确地排除某些想法和方法,需要在 "不 "字前面加上双破折号,如:"--不允许版权符号、正义天平或机器人":"禁止版权符号、正义天平或机器人"。这个人为错误就是为什么 4 幅初始图像中有 2 幅最终包含了正义的天平;这也进一步证明,人工智能并没有根据自己的智能自主地做任何事情--它只是在按照我的指示做,即使我自己的指示出错了。
这幅画是对以相机为主题的原始图像进行大量反复修改的结果。仅相机及其镜头的形状,我就尝试了至少 20 种变化。
这幅图像的意义在于它如何利用了 Midjourney 的 "变焦 "功能,作为一种创意装置,它与拍摄照片时切换相机镜头和放大或缩小的功能无异。
最后一张图片展示了一些变化,最终选定这张图片作为本篇文章开头的 "封面 "或主图片。这张图的意义并不在于它进一步探索了使用虚拟变焦镜头的效果,而在于说明我在基本上选定了前几张图片中的一张作为封面图片之后,决定尝试一些非常不同的东西的时刻,而这一切并没有什么特别的原因。事实上,在我们遇到那些自主的、有知觉的生命之前,我们人类,尤其是那些容易自发进行创造性表达的人类,将是最难以预测的 "机器"。