微信扫码
添加专属顾问
我要投稿
AI提示词版权之争:探讨人类创意与机器产出的边界。 核心内容: 1. 提示词可版权性的两种对立观点 2. 人类控制力在AI生成中的断裂问题 3. 美国版权局对提示词版权的最新立场
在AIGC是否可版权的争论中,有一个问题常被提及,即:用户输入至生成式AI模型的提示词(Prompt)自身是否可版权?
关于此问题目前没有明确的通说,有些观点认为: 当提示词足够“复杂”、并且基于此提示词从生成式AI那里得到了较好的生成物的时候,提示词自身就体现了一定的“独创性”,因此应当给予提示词版权保护。
而有些观点认为:提示词和模型的最终输出物之间没有明确的对应关系,人类通过提示词无法“真正控制”生成式AI最终产出什么,因此提示词无法体现出人类对最终产物的控制力,所以提示词不可版权。这种观点在美国版权局(USCO)在今年1月发布的《版权与人工智能:第二部分:可版权性》中有代表性的体现:
“In other words, prompts may reflect a user’s mental conception or idea, but they do not control the way that idea is expressed (换言之,提示词或许反映了用户的精神概念或想法,但是它们并不能控制这些想法是如何被表达的)。
笔者之前曾撰文讨论过提示词:《神级Prompt是科学精神的倒退》。在本文中,笔者希望深入讨论:提示词自身是否可(应当)获得版权。
很显然,提示词是由人类语言构成的一个序列,普通人类用户将此序列输给生成式AI(下文称为GenAI),然后从GenAI获得与之对应的输出。而由于今日GenAI的种类多样,所以,基于提示词,一个人可以得到代码、图像、乐谱、论文等各种生成物。
而这些基于提示词得到的“东西”,在绝大多数情况下,并不是那个提供提示词的用户有能力“自己动手”得到的。以国内AIGC第一案“春风案”为例,提示词的提供者自身并没有能力“画出”那张图片。他是借助了Stable Diffusion的力量才获得了那张图片。
这里产生了第一个断裂之处,与传统的版权法意义下的作品的产生不同,提示词的提供者和GenAI产物之间缺乏“明确而连续”的人类控制力。这点笔者相信大部分人应当是同意的。
但是问题可以被转化为:用户提供的提示词是否对GenAI的最终产物之间有控制力?或者换个角度问,如果用户基于某一套提示词得到了“较好”的生成物-就像“春风案”中那个美女图片一样。这套提示词是否体现出了用户的“巧思”或者“原创性”?并进一步地基于此种“巧思/原创性”赋予提示词自身可版权性?
对于上述第一个问题,笔者曾经在《无法留白题小诗-对武汉AIGC版权案判决的评论》中仔细讨论过。笔者指出:基于目前的GenAI的技术基础-深度学习-提示词和最终产物之间没有明确的对应关系。GenAI并不是完全依据用户的提示词而“忠实地“给出对应结果,在那个案件中所体现的就是提示词中的“大面积留白”在最终生成图片上没有任何体现-图片的每一个像素都被塞满了。
而USCO在《版权与人工智能:第二部分:可版权性》中也举了一个例子(见下图):
USCO在报告中指出:最终图像反映了一部分提示词(诸如猫叼着烟斗等),但是有一些提示词(Highly detailed wood:高分辨木质)没有在最终图像中被体现。并且,图像中的一些元素(例如猫用手拿着报纸)在提示词中没有任何体现-这是GenAI系统“自做主张”加上去的。
基于这些例子可以看出:至少在目前的AI发展水平下,用户(人)并没有能力通过提示词“控制”GenAI输出什么。这里面有明确的科学原因,但是本文不打算详细讨论。笔者认为,USCO在该报告中引用的美国作家协会对提示词的评论意见是基本到位的:“用户不断地修改提示词就像是在无限可能空间中转轮盘赌 (repetitive prompting to “spinning a roulette wheel with infinite possibilities”)。
对于上述第二个问题(提示词自身是否体现出了用户的“巧思/原创性”?并进一步地基于此种“巧思/原创性”赋予提示词自身可版权性?)笔者认为答案应当为否,理由主要在于:
目前的提示词几乎百分百为人类词汇的组合序列,提示词自身并不是“表达(Express)”,它最多算是用户的精神想法(片段)。提示词不像音乐美术或文学作品,可以为人提供精神体验和享受;提示词也不像计算机代码-这是人类逻辑思维的计算机语言表达,代码其实和文字作品类似,也可以被人所阅读,并且优美的代码“读起来像诗”-也可以给人以精神享受。
目前绝大多数提示词是一段读起来味同嚼蜡的短词组合-就像上面USCO所举的例子那样。笔者相信,没有人愿意付费去阅读“提示词”。
虽然看起来和计算机代码有一定相似之处。即:基于提示词,人们可以让计算机(以及运行于其上的GenAI)完成某种“任务”。这种特性使得提示词看起来具有某种“实用性”。而用户通过“额头流汗”的努力所得到的提示词,似乎和汇编得到的电话号码簿子是一样的-在某些历史时间内,此类电话簿子也是可版权的客体-那么看起来提示词也应当可版权。
此说法最大的混淆点在于:一个人“额头流汗”地汇编电话号码簿子是有明确目的的,在他额头流汗之前他就知道自己要得到什么,他也可以“决定(Decide)”最终电话簿子的内容和形式。而用户“额头流汗”不停地调提示词,他并不明确地知道自己最终要得到什么,并且他也不能决定最终GenAI输出什么。
在国内AIGC第一案中,法官把GenAI比作是相机,把用户提供提示词获得图片比作是一个人拍照。笔者认为这种类比是不正确的,这种不正确的类比与将“额头流汗地汇编电话簿子/额头流汗地调提示词”的错误等同是一样的。在这两种情况下,都抽离/抛弃了人类在创作中的主导过程和主导地位,而隐含地将其代之为机器主导。这其实是目前在讨论AIGC是否可版权问题时常被忽略的一个关键问题。
而即使考虑到提示词在生产生活中有一定的实用性,但是这种实用性是非常“脆弱”的,在时间上很可能无法延续。因为提示词要依赖GenAI才能发挥作用,但是GenAI是在不断迭代的。对某个版本GenAI适用的提示词可能并不适用于另一个版本。这一点在GPT-5推出后,很多用户喊出“还我GPT-4o”,就体现得很明显。从这个角度说,提示词并不像一幅画、一件文学作品那样,具有时间上的持久性和不变性,可以长久地为人们提供精神享受/实用价值,而是随时都有可能“被抛弃”,它的价值也因此变得更加难以度量。
由于提示词是植根于机器造物而非人类造物。所以,提示词可版权论的支持者应该想一想这个事实:并不是只有人类才能写出提示词,机器同样可以生成提示词。事实上,现在已经有相当多的可以生成提示词的工具了-所谓Prompt Generator。而如果人类写出的提示词可版权,那么机器生成的提示词是否可版权?如果可版权,那么权利应当归属于谁?是提示词生成工具的开发者?还是向提示词生成工具输入提示词的用户?
知识产权保护的是人类智慧成果。智慧是愚昧的反面,并且智慧是以人为本的。文艺复兴所体现的正是人的力量和以人为本的美。而提示词-GenAI-生成物体系是一个Ugly的愚昧体系。在该体系下,少数人在资本和计算力量的加持下,攫取了人类所有作品。并向多数人兜售训练好的GenAI接口。这种链条蕴含着潜台词(有时甚至是明示):你无需自己动脑动手真正创造出你配作为作者的新东西,你只需要写一堆提示词,一个远超你智力水平的超级智能可以为你提供一切。这种叙事蔑视了人的创造力,而可以修改GenAI的少数人及其背后的资本,在这种叙事下自然地成了“神”。
如果人们满足于依据提示词所得到的产物,甚至给予提示词以版权保护,则意味着鼓励这Ugly体系下的非人类创作过程。并将在全社会范围内进一步导致人类依据自身能力进行创造性活动的减弱甚至消失,无论是从GenAI训练侧的训练材料提供源,还是从GenAI输出侧的普通用户角度看都是如此。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2025-09-02
2025-06-27
2025-07-20
2025-07-04
2025-09-03
2025-07-03
2025-08-20
2025-07-21
2025-07-03
2025-09-04
2025-09-02
2025-08-11
2025-08-10
2025-07-24
2025-07-22
2025-07-19
2025-07-08
2025-07-04