美国正在审理的一起重要人工智能版权案件——Thaler诉Perlmutter案 ——定于下月在哥伦比亚特区巡回上诉法院进行口头辩论。该案系上诉人斯蒂芬·塞勒在哥伦比亚特区联邦地区法院败诉后提起的上诉。
我怀着既无奈又隐隐忧虑的心情等待着上诉法院的口头辩论和最终裁决,因为这不仅是事实糟糕导致法律糟糕的典型案例,更是因草率且本可避免的事实可能催生出可怕法律的警示——该法律将严重扭曲评估人工智能辅助艺术作品版权属性的关键问题。
泰勒开发了一款雄心勃勃的软件,命名为"创造力机器",它能运用多种人工智能模型和技术,将文本提示转化为视觉艺术作品。其中一幅名为《天堂新入口》的数字绘画被拒绝注册,理由是其创作过程缺乏足够的人类参与度,无法被视为美国宪法及《版权法》所规定的可受保护的"作者"所创作的"作品"。 版权局拒绝注册该画作的原因在于其缺乏人类创作性,正如地区法院所言,该画作实为"计算机自主生成的作品"。

当案件进入地区法院复审版权局驳回决定时,泰勒意识到自己从一开始就陷入了绝境——或许也连累了所有使用人工智能进行图像创作的人——因为他坚持宣称这幅画是由"运行在机器上的计算机算法"独立创作的。 庭审中,塞勒试图改弦易辙,辩称自己"提供了指令并指导人工智能创作该作品",且"人工智能完全受其控制"。然而这些陈述与版权局行政程序记录直接矛盾,根据既定的行政法原则,法院无法采信其辩词,并斥责塞勒"为时已晚"才改变策略。
人们不禁要问,作为软件开发者,泰勒的自我意识或野心是否引导他夸大了该软件"完全自主"的特性。 此举制造了虚假叙事,注定其版权申请失败,为哥伦比亚特区巡回上诉法院几乎必然维持地区法院判决铺平道路——该裁决将确立巡回法院层级的司法先例:人工智能艺术作品因人类贡献微不足道且具有附带性,不具备版权保护资格。
但任何稍有涉猎人工智能艺术创作的人都知道,这类数字艺术作品并非由计算机自主生成。借用地区法院判决书脚注中的表述:倘若具有感知能力的自主非人类主体在主张其法律权利,那么比起版权问题,我们社会面临的将是更为严峻的挑战。
同样地,法院对技术运作方式的描述侧重于强调该过程中的非人性化特征,而谈论软件的实际使用体验则是完全不同的另一回事。
这段摘自2023年版《休斯顿法律评论》中一篇研究扎实的注释的文字,正是前者的一个典型例证:
人工智能艺术生成器通过深度学习与机器学习算法的结合,将文本提示转化为图像。系统会将给定的提示语与海量数据集进行比对,以确定哪些图像与提示中的对象或特征相匹配。随后,AI生成器运用多种算法对选定的图像进行分解重组,最终生成人类可识别的视觉内容。
当法庭主要依据此类关于人工智能创作过程的描述——尽管简洁且事实准确——来裁决版权问题时,人类与人工智能在艺术创作中动态互动的本质便被模糊,甚至彻底迷失。在塔勒的案例中,责任在于其法律策略,因为他几乎强迫地区法院驳回了他代表所谓自主人工智能提出的申请。
更细致入微的人工智能辅助艺术创作?算是吧。
如果泰勒愿意,他本可以采取另一种策略。出于某种原因,他选择向版权局(错误地)声称,他所寻求保护的数字绘画完全由其"创造力机器"独立完成。相反,他本可以尝试为自己对人工智能辅助艺术的人类贡献申请版权,就像克里斯蒂娜·卡什塔诺娃在2022年漫画《黎明之光》中所做的那样。
公平地说,卡什塔诺娃最初并未透露其漫画中的插图是通过Midjourney生成的——这款备受追捧且功能强大的生成式人工智能工具,能将文字提示转化为图像。版权局通过社交媒体获悉卡什塔诺娃女士声称"使用Midjourney人工智能创作了该漫画书"。 对此,版权局通知卡什塔诺娃:除非重新提交申请并明确标注作品中由Midjourney生成的部分,否则其注册将被撤销。

与泰勒坚持己见直至为时已晚仍不愿调整策略不同,卡什塔诺娃及其律师提交了修订申请,明确指出漫画中哪些部分由人工智能创作,哪些部分则非如此。
卡什塔诺娃不仅构思了漫画创意并撰写了文本,还运用Midjourney工具创作了漫画插图,并设计了融合文字与图像的页面布局。版权局顺利完成了文本及"构成作品的文字与视觉元素的整体选择、协调与编排"的注册登记。
然而,版权局拒绝为卡什纳托娃使用Midjourney创作的图像授予版权——并非因为她像塔勒那样否认自己在创作过程中的作用,而是因为版权局指出,Midjourney"以不可预测的方式生成图像"。 尽管版权局承认卡什纳托娃在创作过程中的作用,并表示"额外提示词……可影响后续图像生成",但其仍认为"该过程不受用户控制,因为无法预知Midjourney将生成何种内容"。基于此,版权局直截了当地得出结论:"就版权目的而言,Midjourney用户不构成'作者'。"
哎哟。
我尚未发现任何案例或法律评论文章将"可预测性"作为原创性分析的考量因素。 遗憾的是,卡什塔诺娃并未提起上诉,这很可能是因为她第二次为漫画申请版权时,既获得了修正版权局所指缺陷申请的机会——该申请因未披露人工智能使用情况而存在瑕疵——同时也能成功获得漫画的版权保护:既涵盖标题、文字故事,更重要的是作为包含页面布局与插图设计的整体作品获得版权。 虽然上诉也难有转机,但案件终结仍令人困惑:版权局究竟依据何种理论,将人类创造力等同于特定表达媒介下结果的可预测性?
镜头之下
这种绝对主义立场与19世纪中叶摄影术诞生时法院(及公众)的反应如出一辙。相机最初普遍被视为机械装置,是科学技术的产物。在摄影术走向文化普及的最初几十年里,摄影师作为享有著作权保护的"作者"这一概念几乎不存在。
相机被视为人类创造性过程中的工具,但许多早期评论家却将人类视为机器机械运作过程中的附属操作者。1889年柯达新款大众市场相机的广告最能概括这种将摄影本质视为自主过程的观点。在黑色小盒状设备的图像旁,赫然印着这样的标语:"您按下快门,其余交给我们。"
十五年前,在1884年的" 伯罗-贾尔斯平版印刷公司诉萨罗尼案 "中,美国最高法院曾有机会回答一个问题:按下相机快门是否具有足够的创造性和原创性,足以构成版权意义上的"作者身份"。法院并未直接解决这一问题,而是选择将必要的创造性归结于按下快门之前的操作环节。 时隔百余年,法院仍沿用相同逻辑——1998年某地区法院案件中援引"摄影师对背景、光线、阴影、拍摄对象位置及时机选择";2010年第十一巡回法院案件则强调"关于照明方案、适配相机设备与镜头、相机参数设置及背景运用的决策"。
尽管版权制度最初在摄影技术面前举步维艰,最初仅将构图最精妙的摄影作品视为原创艺术,但主流观点逐渐意识到人类审美选择渗透于大量摄影作品之中。正如苏珊·桑塔格所言:"当人们迅速发现无人能拍摄出完全相同的同一景物时,相机提供客观无主观影像的假设便让位于这样一个事实:照片不仅记录存在的事物,更呈现个体的视角。" 正如法律权威莱纳德·汉德法官在萨罗尼案四十余年后所言:"任何照片——无论多么简单——都无法摆脱作者的个人影响,且绝无两张照片能完全相同。"
魔灯
我付费订阅Midjourney大约已有18个月,期间轻松创作了至少上千幅图像。我用它制作过数字绘画、插画、漫画、网站界面设计等作品。 所谓Midjourney并非创作工具、而是无需人类实质干预即可生成不可预测图像的独立智能体——这种观点荒谬至极,令人不禁质疑:那些将我们推向这条老路上的法官或版权局工作人员,可曾真正用Midjourney或其同类工具创作过哪怕一张图像?
我提供以下图像,仅为证明Midjourney可成为艺术家手中的工具——其创作成果(包括有意识运用Midjourney时)都烙印着艺术家的印记,无法合理地将其简单解读为独立于人类非偶然性参与之外、由自主过程产生的不可预测结果。
前两幅是我大约十年前创作的传统混合媒介作品。
后两幅作品大约是一年前用Midjourney创作的。

最后两件是我今年夏天创作的传统混合媒介作品。
就我而言——这其实是我想强调的核心观点——所有这些作品都折射出我艺术视野的某些片段,无论其具体形态如何,无论它们是在阳台用颜料、纸张、剪刀和粉彩创作而成,还是在厨房餐桌前面对MacBook完成的。我始终认为,当使用传统材料进行传统艺术创作时,重大不确定性的时刻无时无刻不在发生。 任何稍有接触美术用品店的人,都见过丙烯画师可用的颜料、凝胶、稀释剂、遮盖膜等产品令人眼花缭乱的种类——这只是其中一例。 无数个夜晚,我怀着忐忑入睡——那些在阳台晾晒的画作次日清晨会呈现何种面貌?毕竟从未尝试过这种特定技法与材料组合。从这个角度看,Midjourney或许比满车传统画材更具可控性——尤其当你掌握其"语法",并将其作为创意表达工具积累经验后。
为这篇博客创作插图时,我使用了Midjourney。作为该工具的常用户,我带着明确的创作意图和实现路径着手:既要捕捉特定场景的氛围,又要实现预设的视觉风格。这些作品旨在展现使用Midjourney为特定目的创作图像的过程体验,呈现其独特的视觉风格与情感表达。 之所以说"部分",是因为要创作出符合我个人审美的图像,往往不仅需要对图像本身进行多次迭代(通常是数十次),还需通过不同缩放级别的迭代、基于不断优化文本提示的迭代,或是仅对图像中用户指定区域进行局部调整的迭代来实现。
话虽如此,我认为从创作过程中数十次迭代中摘录的以下系列图像,仍暗示着一种比版权局或美国法院此前承认的更为细腻复杂的创作过程。
第一组图像是由Midjourney根据用户文本提示生成的初始4张图像,我已将其包含在此:
现代彩色绘画采用湿润颜料,随性书写与笔触,映射出从相机到人工智能的主题——版权法必须随技术演进;不见版权符号、天平或机器人——v 5.0
精明的观察者若熟悉Midjourney便会发现,我在提示语中搞砸了"no"部分的设置——要让软件正确排除某些概念和元素,必须在"no"前添加双破折号,例如:"—no copyright symbols, scales of justice or robots." 正是这个人为失误导致最初四张图像中有两张出现了天平元素;这也进一步证明AI并非基于自身智能自主运作——它完全执行我的指令,即便我在指令中犯了错误。
这张图像是在原始相机图像基础上经过大量迭代处理的结果。仅相机机身和镜头的造型,我就尝试了至少20种不同的变体。
这幅图像的意义在于它巧妙运用了Midjourney的"变焦"功能——这种创作手法与摄影中更换镜头、拉近或拉远焦距的能力如出一辙。后者正是摄影艺术最常被推崇的特性之一,它既能展现人类的创造力,又能超越单纯按下快门的机械操作。
这张最终选定的封面图,展示了从初始构思到最终定稿的创作演变过程。 此处呈现该图的意义,与其说是进一步探讨虚拟变焦镜头的视觉效果,不如说是为了展现一个关键时刻——当我基本确定采用前述某张图片作为封面后,却突然毫无缘由地尝试了截然不同的创作方向。事实上,在人类邂逅那些自主的、有感知能力的生命体之前,我们——尤其是那些倾向于即兴创作的人类——始终是世间最难以预测的"机器"。















