来源
《中国社会科学文摘》2023年第11期P149—P150
作者单位
中国社会科学院大学新闻传播学院,摘自《新闻记者》2023年6期,王建峰摘
作为一种现象级的技术应用,ChatGPT不仅给多个行业带来了新的可能,也对现行法律制度提出了挑战。新技术正在考验著作权法调整信息与内容产品市场的能力。
近年来,人工智能不再局限于对已存在内容的分析,而是能够基于数据训练和算法生成模型自主生成多种形式的新内容,实现了从感知理解到生成“创造”的飞跃。人工智能生成物的出现也给著作权法带来了一系列新的挑战,近年来,学界和业界围绕人工智能生成内容的可版权性等问题进行了讨论。
学界对于人工智能生成物的法律属性尚未形成统一意见。有些学者认为人工智能生成物不能构成著作权法意义上的“作品”。多数国内学者则认为人工智能生成物具有可版权性,主要观点包括“客观主义标准说”和”工具说”等。
在客观主义标准下,ChatGPT生成内容具备表象层面的可版权性。
客观主义判断标准适用的前提是生成内容源自人,只有对于自然人的创作成果而言,依据创作结果讨论独创性才是可行的。如今,ChatGPT等生成式人工智能直接介入了内容的创造性生产过程——直观看来,人们不再是利用计算机以新的方式生产作品,而是让计算机用新的方式生产作品。因此,在忽略“作品是人的表达”这一前提的情况下,直接运用客观主义标准去评判非自然人生成内容能否构成作品是不妥当的。在仅考虑作品本身的可区别性、不考虑创作主体和过程的情况下,不仅机器生成的内容具有可版权性,动物乃至自然界中产生的“符号组合”都可能构成作品,这将造成著作权客体范围无端扩张,动摇私人利益与公共利益的平衡甚至著作权法律制度的稳定。
判断ChatGPT生成内容能否构成作品的关键,在于厘清其生成内容与人的关系,即人在ChatGPT内容生产过程中是否发挥关键作用。
有观点将人工智能视为人类进行创作的工具,并在此基础上主张人工智能生成内容的可版权性。
将人工智能看作人之创作工具的观点混淆了以上两个概念:ChatGPT生成内容属于“人工智能生成的”产出,不是“人工智能辅助完成的”的产出,因此不具有可版权性。
生成式人工智能在吸引学界围绕创造性、表达和作品本质等深层问题进行讨论的同时,也使著作权法律规则不得不面临一些紧迫的现实挑战。尽管人工智能自动生成的内容不具有可版权性,但ChatGPT在模型训练和生成物利用过程仍会挑战现行著作权法甚至产生侵权风险,具体体现在文本生成、大规模机器学习和生成物利用三个方面。
ChatGPT在文本生成过程中并不会直接抄袭已有作品,而是进行重新组合。有学者通过测试发现,ChatGPT的功能之一是“智能洗稿器”:即使搜索出了与问题直接相关的信息,ChatGPT也不会直接对文字内容进行“复制粘贴”,而是会进行同义词替换,即运用不同于原内容的文字组合表达相同的观点,ChatGPT通过非复制粘贴使用自然语言的模式可能会规避《著作权法》对作品的保护。
ChatGPT之所以表现出较高的文本理解能力,一个重要原因就是有生成式大规模语言模型作为强大的“基座”。这一语言模型需要预先基于TB级的文本和数据进行大规模训练,从中学习隐含的人类语言规律和模式。
为了满足社会对知识和信息的需求,各国著作权制度均规定了著作权的限制和例外,其中,合理使用制度是著作权限制最重要的一种形式。
大规模机器学习适用合理使用规则会对著作权法律制度本身提出挑战。一方面,著作权制度的根本价值在于维护个人利益与公共利益之间的平衡,其所有规则的核心宛如一张由私人利益和公共利益错综交织的网络;合理使用原则设立的初衷是平衡著作权法保护作者和其他著作权人的利益与促进知识、信息广泛传播的双重目的,其最直观的考虑是不允许使用他人作品会阻碍自由表达与思想交流,因此,其最关注的行为是非营利性目的的使用。在生成式人工智能的大规模机器学习行为中,实际的版权作品大量使用者是开发人工智能的企业,其对作品的使用最终是为了吸引更多的用户、获取更多的商业利润,就使用性质而言是商业性的而非公共性的。另一方面,知识产权法的一个重要作用是促进知识创新,但ChatGPT本身无法创造新的知识,而是基于既有的人类知识储备进行“知识重组”,其生成内容的新颖性、权威性等值得进一步考量。合理使用制度的初衷也是为解决后续作者为创作新作品如何利用先前作品的问题。如果大规模机器学习的最终结果并不是为了生成具有新颖性的内容和促进人类知识创新,将这一行为纳入合理使用范畴也背离了知识产权保护的目的。
如果ChatGPT在模型训练过程中从大规模受著作权法保护的作品学习自然语言规律,那么模型很有可能生产出与输入数据相似的内容。运用ChatGPT的洗稿行为可能存在道德风险;如果用户在创作物中使用了ChatGPT生成的、与训练数据中的版权作品构成实质性相似的内容,则可能会侵犯原作品的著作权。自2022年起,有不少学生开始使用ChatGPT代替自己撰写论文、编码;目前已有多家期刊声明完全禁止或严格限制使用ChatGPT等生成式人工智能撰写学术论文。
有学者在早先论述人工智能生成内容的法律属性时,也曾提及其与作品难以分辨的情况,如今这一现实问题的解决显得更为迫切。美国版权局最新发布的公共指导法案即对此提出了明确要求,作者在为视觉、文本作品进行版权申请时,应注明哪些部分由人工智能完成、哪些部分由人类完成;如果人工智能生成部分超出最大限制,则不应该放在作品中进行版权申请。人工智能生成物不是受著作权法保护的作品,而作者如在自己的作品中使用了人工智能生成内容作为其中一部分,有必要对来源进行说明。
综上所述,ChatGPT生成内容不具有可版权性,其生成物不能满足“作品的作者是自然人”这一基本前提,且将其视作人类创作工具的观点混淆了“人工智能生成的”和“人工智能辅助生成”的内容。但ChatGPT的广泛使用也为现行著作权法带来了一些现实挑战。机器学习过程中的文本数据挖掘行为可能构成著作权侵权,但其能否适用合理使用规则还需要进一步细致考量;ChatGPT生成内容在利用时可能会侵犯原作品著作权,未来可通过电子水印等技术对人工智能参与创作的内容进行识别,并按照人类是否对作品进行主要选择和安排之标准对独创性加以判断。
法律制度具有滞后性,但对于法律问题的思考应具有前瞻性。近年来,大数据与人工智能技术的迅速发展引发了人工智能能否作为适格著作权主体等相关讨论。当前,ChatGPT等生成式人工智能对人类行为的模拟仅限于内容创作,与强人工智能还有很大差距。若未来人工智能技术发展到了具有自主意识的阶段,也需要民法在主体制度中对人工智能之法律地位做出回应,而不是在著作权法领域率先进行突破性变革。此外,权利的实现与义务的履行往往相伴而生,不能因人工智能生成内容与人类作品具有表象性相似便急于对其提供保护,也应考虑侵权责任的承担。如果著作权法为人工智能生成内容提供了保护,当生成内容侵犯他人权益时,权利所有人也应为其“创作”承担侵权责任。若生成式人工智能的所有者、研发者或使用者享有机器生成物的权益,那么当这些内容侵犯他人复制权、改编权或构成诽谤侵犯他人人格权益时,他们就需要为此担责。考虑到ChatGPT等生成内容的实际过程,由并未直接参与创作的自然人或法人来承担机器创作物的侵权责任不具有足够的合理性。自1709年《安娜法》颁布以来,技术变革总是为著作权法律制度带来新的紧张。著作权法在未来对人工智能生成技术带来的新问题进行回应时,不仅要考虑技术自身的变革程度,也要考虑其对公共利益与私人利益之平衡的影响程度,对既有法律规则变革与否,需要在著作权法基本原理的基础上探寻其在新技术背景下的适用条件。
(本文注释内容略)
转自:“中国学派”微信公众号
如有侵权,请联系本站删除!