一、 引言
近年来,生成式人工智能技术的迅猛发展深刻改变了内容创作的方式。用户仅需输入简单的文字指令(如提示词)或更复杂的表达性描述,AI模型即可生成文本、图像、音乐等多种形式的输出内容(下称“AI生成物”)。这一技术革新在提升创作效率的同时,也引发了关于AI生成物可版权性的广泛争议。核心问题在于:用户输入的指令能否使AI生成物具有可版权性并使其成为AI生成物的“作者”?
目前,各国法律体系对AI生成物必须有人类创作才可能构成作品已形成共识,但具体衡量标准则不尽相同。中国《著作权法》强调作品的“独创性”必须源于人类的智力活动。而美国版权局(USCO)在《版权与人工智能:可版权性》报告中明确指出,单纯由AI生成的内容不受版权保护,除非人类对其创作过程具有充分控制。随着用户对AI生成过程的参与程度加深(如多轮指令调整、参数设置等),各国司法实践中对此问题的认定标准逐渐出现差异。
本文将从用户指令的基本概念、用户指令表达性以及对AI生成物控制力等角度,探讨用户指令对AI生成物可版权性的影响。
二、 关于用户指令的分析
1、用户指令的基本概念
根据中国国家标准《人工智能 大模型 第1部分:通用要求》(GB/T 45288.1-2025),提示词(Prompt)指的是“使用大模型进行微调或下游任务处理时,插入到输入样本中的指令或信息对象。”以此可见,提示词,即用户指令,指用户输入给人工智能系统的指令或问题,是用户与人工智能模型进行交互的核心要素。提示词用于引导AI生成所需的回应或执行特定任务。
用户输入的指令千差万别,可以是一个问题、一段描述、一组关键词或上下文信息。根据指令的复杂程度,可分为简单指令、多步骤指令;从表达风格角度,可分为精确指令、模糊指令、开放式指令等;从功能角度,可分为内容创作类指令、设计创意类指令等。不同提示词“引导”得出的结果也千差万别,“好的”提示词可以最大限度发挥AI模型的能力,生成满足用户需求的成果,而“差的”提示词则完全无法实现用户目的。有鉴于此,目前已出现了一门专门的学科——提示词工程(Prompt Engineering),涵盖提示词的设计、优化、上下文管理以及与大模型交互的策略,通过设计和优化输入提示的过程,以引导模型生成预期的输出或行为。高级的提示词技巧甚至还包括元提示(让模型自我优化提示词)、多模型协作(结合推理型模型(创造性任务)与指令型模型(稳定性任务),通过提示工程实现优势互补)等极为复杂的提示词设计。
2、AI生成物的可版权性的路径
基于人工智能及指令学科的发展,我们认为,分析AI生成物的可版权性,可以从以下两个路径考虑:
(1) 用户指令的表达性;
(2) 用户指令的控制力。
前者体现了用户本身的智力投入,后者则决定了AI生成物是否可反映用户作为“人”的创作意志。
3、用户指令的表达性分析
若提示词仅仅是个别字词或字词的简单组合,通常情况下并不符合独创性中“独”的要求。如提示词“白衬衫”并非源于用户本人、也并非其所独立创作。字词的简单组合形成的简单指令性语句,由于缺乏最起码的长度,往往难以较为完整地表达用户的思想感情或传递一定量的信息,因此不符合独创性中“创”的要求。
正如美国版权局发布的Copyright and Artificial Intelligence, Part 2: Copyrightability(《版权和人工智能:可版权性》,下称“可版权性报告”)所述,提示词本质上是传达思想的指令1。用户向人工智能模型输入提示词所生成的内容,由于用户仅仅提供过了思想,AI生成物并不是基于用户创作行为所产生,也不是由用户的自由意志所决定,显然不构成作品。
若用户输入的指令足够具体,且满足构成《著作权法》项下作品的“独创性”要求,则用户输入的指令本身可构成作品。
但指令本身构成作品并不必然导致AI生成物构成作品。在该情形下,我们认为在如下两种情况下,AI生成内容也可能构成作品:
(1) AI生成内容将用户输入指令“纳入”最终生成内容(但构成作品的部分仅是用户输入部分)。例如,用户输入了一段独创性表达,通过指令设计安排AI对文字进行翻译、润色、整合等处理。在该情形下,新的润色/翻译/整合内容本身并非自然人自身的独创性智力成果,不能体现个性化筛选、表达,不应被视为新的智力成果,但对于经处理被纳入的、具有独创性表达的用户输入指令部分,可以构成作品。
(2) 用户通过精细设计的指令,最终操控AI生成了体现其意志的成果。理论上,在AI足够发达的情形下,在理解相关AI指令基本原理后,通过类似前文提及的提示词工程,通过精心设计的指令,用户可以“操控”AI生成体现其意志的成果。
4、用户指令的控制力
我们认为,由于目前的AI生成物仍具有高度不可预测性,用户无法实质性控制AI生成物。
根据我们的体验,目前的人工智能模型(如ChatGPT、Deepeseek、混元等)仍未进化到可以完全精准准确理解用户指令的智能性。而现有的提示词工程也更多是通过优化指令生成“相对”符合需求的内容,远无法达到精确“控制”AI生成体现意志的成果。因此,我们认为,现阶段用户无法控制AI生成物的生成过程以及生成结果。若未来随着人工智能模型的发展,用户能够基本控制AI生成物的生成过程及结果,此时用户指令则可能对于AI生成物产生实质性贡献。为更深入地讨论控制力问题,我们从以下两个角度进一步分析:
角度一:用户对提示词的多次修改并无法实质影响其对AI生成物的控制力
首先,用户根据人工生成模型生成的具体内容不断修改提示词生成最终AI生成物的过程,即便耗费了大量的时间与精力,由于《著作权法》并不保护体力劳动或“额头流汗”的成果2,用户多次修改这一事实与判断AI生成物是否可版权无关。
其次,根据人工智能模型具体生成的内容对提示词进行修改,并不能导致用户对最终AI生成物具备控制力。用户多次修改提示词的过程,实际上是在人工智能模型提供的多个AI生成物选项中进行筛选,这一“筛选”过程并不是创作行为。如美国版权局可版权性报告所述,无论用户对提示词进行多少轮次的修改,并不影响用户只能“消极”接受人工智能模型对提示词的阐释这一事实。
角度二:同类指令生成同类物并不能导致AI生成物中AI生成部分具有可版权性
在同类指令生成同类物(如文生文、图生图)的场景下,部分人工智能模型仅仅对有表达的指令(如文字、图片)进行少量修改,仍保留了用户指令中的基本表达,此时AI生成物能否构成作品,即是否能认定用户创作了保留其基本表达的AI生成物?
王迁老师类比改编作品原理对前述问题给予了否定结论,“如果一部作品因被复制或者改编而在另一部作品中被体现出来,则对另一部作品未经许可进行利用也会侵害第一部作品的著作权。但这并不意味着第一部作品的作者实施了对第二部作品的创作行为”3。在同类指令生成同类物场景下(以“图生图”为例),用户以其自行创作的美术作品输入人工智能模型,并输入提示词要求人工智能模型对美术作品进行调整,所产生的AI生成物当然有可能体现用户最初创作的美术作品(包含保留了用户表达的复制品或衍生品),他人未经许可使用AI生成物当然侵犯了用户对美术作品享有的著作权。然而,如前所述,由于用户对AI生成物缺乏控制力,无法证明用户创作了AI生成物中的AI生成部分。
三、 中美司法实践在认定用户指令对AI生成物可版权性影响的异同
1、中美均认可仅人类可作为创作主体
中美两国均强调版权保护的核心在于人类作者的独创性智力投入,只有人类才能成为作品的作者。如在A Recent Entrance to Paradise(《通向天堂之近路》)案中,计算机科学家泰勒在向美国版权局提出《通向天堂之近路》的作品登记时,明确披露内容是在没有任何人类智力贡献的情况下自主“创作”,美国版权局版权复审委员会以“版权法只保护基于人类心智的创作能力而产生的智力劳动成果。美国版权局将不会登记在缺乏人类作者创造性投入的情况下,由机器或者纯粹机械过程而生成的内容”为由,并拒绝了泰勒的登记申请。在“北京菲林律师事务所诉百度案”中,原告主张被告未经许可使用法律统计数据分析软件生成的分析报告侵害其著作权。北京互联网法院认为:“自然人创作完成仍应是著作权法上作品的必要条件……由于分析报告不是自然人创作的,……不是著作权法意义上的作品”。
2、两国对用户指令能否使得AI生成物具有可版权性的认定存在差异
(1)美国
美国版权局在其发布的可版权性报告中指出,“提示词的本质功能为传达无法保护的思想指令功能。尽管详细的提示词(即有表达性的指令)可能包含用户的表达,但目前用户无法控制人工智能系统如何产生AI生成物”4,因此美国主流观点认为,用户指令无论复杂与否、无论经过多少轮次指令调整,均无法使AI生成物具备可版权性。判断AI生成物是否具备可版权性的核心要素是“人类控制力”。在Théâtre D’opéra Spatial案(《太空歌剧院》)5,美国版权局审查委员会认为,虽然部分提示词本身可能具备足够的创造性而构成受版权保护的文学作品,但图像生成的最终结果本质上仍取决于Midjourney系统对提示词的理解和处理机制。因此,向AI系统提供文本指令这一行为本身并不能“实际形成”(actually form)最终图像,申请人也未对图像构成要素实施有效的“创作性控制”(creative control)。
(2)中国
国内学界与司法实践对于用户指令对AI生成物可版权性的影响目前尚未形成统一观点。从现有司法案例来看,用户指令能否导致AI生成物具有可版权性的核心判断要素在于用户在AI生成物生成过程中的实质参与性与贡献度,而用户对提示词和相关参数的选择、指令的多轮调整、对最终生成物的选定等都可能被认定为实质性参与了创作,进而使AI生成物具备可版权性。在“春风送来了温柔”案6中,北京互联网法院认为,原告通过输入提示词、设置相关参数,获得了第一张图片后,其继续增加提示词、修改参数,不断调整修正,最终获得了涉案图片,这一调整修正过程亦体现了原告的审美选择和个性判断。因此,涉案图片并非“机械性智力成果”。在无相反证据的情况下,可以认定涉案图片由原告独立完成,体现出了原告的个性化表达。
四、我们的建议
基于前文分析,中美两国在AI生成物可版权性认定方面存在差异,同一AI生成物在两国法律体系下将可能遭遇“版权保护落差”。为避免经过努力投入生成的生成物无法获得保护,对于使用AI工具开展“创作”的用户,我们建议:
1. 附加人类加工环节:目前从中国的司法案件中可见,用户指令越详细,调整轮次越多,可版权性的可能性越大。在AI生成后,加入更多人工审核、选择、调整、汇编、改编的投入,可版权性的可能性越大。
2. 仅将AI内容作为灵感来源或者收集资料的用途:由于AI工具具有强大的逻辑性及资料收集能力,实践中越来越多人将AI作为“头脑风暴”或者“搜索引擎”辅助创作,通过参考AI提供的灵感及资料辅助人类的自行创作。我们认为,在该模式下人类才是创作的核心主体,体现了人类智慧主导原则。
3. 对“创作过程留证”:对AI生成过程进行留证,以证明人类贡献度,特别是依据的原始素材(例如,用户自行创作了独创性表达性内容的情形)、人类发出的具体指令、后续的指令调整、参数设置过程等。
我们也期待司法实践可以对用户指令及AI生成物的可版权性问题确立更为统一、审慎的法律标准,既充分保护人类创作者的独创性表达权益,亦避免因过度保护机器生成内容而压缩人类创作空间。
注:
1. Copyright and Artificial Intelligence, Part 2: Copyrightability, https://copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-2-Copyrightability-Report.pdf.
2. Feist Publication v. Rural Telephone Service, 499 U.S. 340, 341-344 (1991).
3. 王迁:《三论人工智能生成的内容在著作权法中的定位》。
4. Copyright and Artificial Intelligence, Part 2: Copyrightability, https://copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-2-Copyrightability-Report.pdf.
5. Théâtre D’opéra Spatial, https://www.copyright.gov/rulings-filings/review-board/docs/Theatre-Dopera-Spatial.pdf.
6. 北京互联网法院:(2023)京0491民初11279号民事判决书。
声 明
君合官网所刊登的文章仅代表作者本人观点,不得视为君合律师事务所或其律师出具的正式法律意见或建议。如需转载或引用该等文章的任何内容,请注明出处。未经本所书面同意,不得转载或使用该等文章中包含的任何图片或影像。如您有意就相关议题进一步交流或探讨,欢迎与本所联系。