前言
2024年2月15日,人工智能公司OpenAI公布了最新的文生视频大模型“Sora”。只要输入一段文字,Sora便可以根据用户的文本提示,理解用户在提示中表达的特殊需求。其采用类似于GPT-4对文本令牌进行操作的方式来处理视频“补丁”,并能够生成长达60秒钟的一镜到底视频。Sora还具有对物体在物理世界中存在方式的理解,可以进行深度模拟真实物理环境,生成包含多个角色、涉及特定运动的复杂场景。
Sora发布引发了大家对ChatGPT、Midjourney等生成式人工智能的生成内容所面临的著作权问题的进一步关注及探讨。本文拟结合我国“人工智能文生图著作权侵权国内第一案“[1](以下简称“春风图案”)以及“AIGC著作权侵权全球第一案”[2](以下简称“奥特曼案”),对AIGC的相关著作问题进行探讨,同时也拟基于Sora发布的背景,以Sora为例对未来AIGC的著作权问题可能面临的挑战进行初步讨论。
一、AIGC能否被认定为“作品”,受到《著作权法》保护?
《著作权法》第三条将作品定义为“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,因此判定AIGC是否能够被认定为“作品”,一般需要从四个方面进行考虑:1.是否属于文学、艺术和科学领域内;2.是否具有独创性;3.是否具有一定的表现形式;4.是否属于智力成果。AIGC属于文学、艺术领域,能够借助文字、图像、视频等形式可被人类感知与欣赏,从一般人的角度来看,明显属于艺术领域,并具有一定的表现形式。因此,在理论与实务中,大家重点关注内容主要为AIGC是否为智力成果,以及其是否具有独创性。
1.AIGC是否属于“智力成果”?
“智力成果”是指智力活动的成果,体现了智力活动主体的智力投入。根据传统著作权法的观点,“智力”是自然人独有的思想,即只承认人类能够成为进行智力活动的主体。[3]在生成式人工智能横空出世后,国际知识产权保护协会发布了《关于人工智能生成物的版权问题决议》,认为AIGC只有在其生成过程有人类干预(human intervention),且在该生成物符合受保护作品应满足的其他条件的情况下,才能获得版权保护。即,如果有人类参与,生成式人工智能进行生成的过程便能够被视为人类进行智力活动的过程,在理论上满足“智力成果”的条件。
在“春风图”案件中,针对案涉AI生成物是否属于智力成果这一问题,法院认为:“智力成果”是指智力活动的成果。因此,作品应当体现自然人的智力投入……本案中,原告创作过程进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等等。涉案图片体现了原告的智力投入,故涉案图片具备了“智力成果”要件。即,简而言之,如果利用人工智能制作生成物的主体“进行了一定的智力投入”,便能够让该生成物满足“智力成果”的条件。
2.AIGC是否具有“独创性”?
独创性(Originality),主要包括“独”和“创”两部分。在我国司法实践中,“独”指“独立创作,源于本人”——即,劳动成果是劳动者从无到有独立地创造出来的,或是对已有作品进行再创作,而由此产生的保留了原作品基本表达的成果且与原作品之间存在着可以被客观识别的并非太过细微的差异;而“创”则意味着作品必须具备一定程度的创造性,体现作者的个性化表达。[4]
在判定AIGC是否具有“独创性”的问题上,笔者认为,核心的判断因素是体现作者的“个性化表达”,以使其具有“独创性”。综合智力成果与独创性的判断,我们认为判断AIGC能否构成作品的重要标准之一为“作者的智力投入与个性化表达”,判定过程中可以考量作者所参与的“增加提示词、修改参数”“调整修正”等行为进行判定。
例如在“春风图”案件中,针对AIGC是否满足“独创性”的问题,法院认为,利用人工智能生成图片,是否体现作者的个性化表达,需要个案判断,不能一概而论。在该案件中,利用Stable Diffusion 类模型生成图片时,其所提出的需求与他人越具有差异性,对画面元素、布局构图描述越明确具体,越能体现出人的个性化表达。原告对于人物及其呈现方式等画面元素通过提示词进行了设计,对于画面布局构图等通过参数进行了设置,体现了原告的选择和安排。另一方面,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。因此,利用该模型进行创作,不同的人可以自行输入新的提示词、设置新的参数,生成不同的内容。涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。综上,涉案图片具备独创性要素。
又如美国版权局在2023年2月给予漫画《Zarya of the Dawn》版权登记时,也采用了类似的逻辑。[5]2022年9月,数字艺术家Kris Kashtanova向美国版权局提交了该漫画书的版权登记申请并获得批准,然而在得知漫画中的图像是由Midjourney生成后,美国版权局于2023年2月撤销了原先的版权登记并重新给予新的版权登记范围,明确排除对AI生成的图画本身的版权登记。尽管Kashtanova通过声称其对漫画中的图画进行过PS加工处理来主张其对该部分拥有版权,版权局指出:AI生成内容被人工编辑、修改后,含有该类素材的新作品可以受版权保护,但前提是该新作品具有充分的独创性,而Kashtanova对图画的修改远未达到该标准。但由于漫画书中由Kashtanova人工创作的文本以及Kashtanova对文本和AI生成图画的选择、协调、编排体现了其创造性贡献,该部分内容将作为未出版的文学作品重新被予以版权登记。版权局明确指出,Kashtanova对文本和图画的选择、编排构成汇编作品,受版权法保护。
3.Sora发布之后,针对AIGC是否构成作品的判定思考
2024年2月15日,OpenAI公司公布文生视频大模型“Sora”,并在官网发布了“研究报告”,展示了目前Sora生成的实例。[6]在现阶段Sora的官网“研究报告”宣传视频中,OpenAI 展示了生成提示词与对应生成的视频,比如下面这个视频:
“一个穿着蓝色牛仔裤和白色T恤的女人愉快地在南非约翰斯伯格的冬日暴风雪/南非约翰斯伯格的美丽落日/印度孟买的美丽落日中漫步”
根据这个来自Sora官网的示例,即使只是基于简略的描述,生成视频的精细度与拟真度以及基于关键词进行联想补足的能力都相当之高。Sora甚至还能够自行根据场景加入不少未曾提到的细节——在所生成视频的背景中,人群、车流、树木等元素都是Sora通过提示词中的地点“印度孟买”自行生成的。
眼前的Sora生成物抛给了我们两个问题:首先,根据上述例子我们可以推测,视频载体本身比图片要复杂的特性以及Sora强大的联想能力,会使得生成物中脱离指令者想象与控制的部分被进一步扩大,“独创性”的认定难度也会进一步加大。
根据“春风图”案件审判逻辑,Stable Diffusion中提示词与参数各种要素的共同作用体现了原告的审美选择和个性判断,因此生成图片具有足够的独创性。而在这个例子中,生成提示词中已然加入了许多细节词汇(如人物性别、穿着、地点、天气等),但生成视频的细节则远远超出了一般使用者的期待。在目前智力投入和个性化表达认定还未有一个清晰标准的情形下,我们难以对其中的个性化表达是否足够来判断生成物是否具有独创性。诚然,Sora还没有正式对外开放使用,我们也无法具体得知指令者可以进行哪些方面的介入或是对视频的哪些方面进行调整,还需要通过更多的实际使用信息辅佐来进行探讨及论证。
其次,Sora的强大能力或许还会给未来的司法判决带来基于先前判例之上的新挑战——即这些新时代视频生成物的可版权性,或许需要一个比美术作品要高的门槛。我们提出如此想法的原因,源自于对AIGC与人类投入之间的不平衡的思考。许多学者曾针对人类指令者的行为和最终生成作品效果之间的因果关系对生成物的可版权性进行讨论,如Balganesh指出了三个认定因果关系的元素:(1)输入提示词的人类是否对AIGC生成的过程有足够的控制;(2)生成物的最终呈现是否与指令者的贡献成比例;以及(3)在输入指令后生成物是否能够体现作者的创意选择。[7]随着AI生成技术的进化,AI使用者用同样的投入所获得的生成结果会不成比例地被放大——从图片到视频,从低劣模仿到高度拟真,AI使用者仅需进行一些简单的操作,就可以在极短时间内生成大量可版权的作品,并因此稀释掉许多人类创作者的作品。投入与生成的差异越大,这种给行业带来的风险便越严峻。以上述Sora的生成实例为例,人群、具有印度特色的车流等特征的特定组合所形成的背景,仅是基于一句“印度孟买的美丽落日”而生成的,而且生成的是高拟真度、高帧率的视频,远远超出了一张文生图的规格与质量。仅凭一些简单的描述,就可以生成人类创作者需要花费时间精力与财力去进行取景拍摄或是虚拟建模才能得到的结果,这样的结果与指令者的付出显然不成比例。虽然根据Sora的实际使用状况,指令者或许可以通过调节参数和其他设置,对视频的最终生成有所贡献,但这对于生成视频质量的影响也略显得“杯水车薪”,这无疑给独创性的认定带来了全新的挑战。或许,这种“因果关系”的判断,今后也可能会被法院纳入考量范围之中。
二、AIGC著作权归属问题
AIGC著作权的权属应当归谁,也是自AIGC面世以来被广泛讨论的一个问题。不同的观点各自认为,AIGC应当归AI产品用户、AI公司、甚至是AI本身。在“春风图”案件中,法院在判定AIGC著作权归属问题提供了较为明确的指引,法院认为:
根据《著作权法》第十一条等相关规定,作者限于自然人、法人或非法人组织,这与民法典规定的民事主体一致,故人工智能模型本身无法成为我国著作权法上的作者。正因如此,虽然涉案图片是涉案人工智能模型所“画”,