核心阅读
对AIGC监管的相关问题需要考虑四个方面,一是监管何时介入,需要考虑技术的负外部性导致的风险程度高低;二是监管对象的选择,是选择技术和服务本身,还是考虑背后的风险与法益;三是做到结果型与过程型监管的平衡;四是考虑基础设施打造和监管生态的完善。
ChatGPT上线后的大火出圈,让AIGC(即AI generated content,人工智能生成内容)这一赛道在近期受到世界范围内的高度关注。
嗅觉最为灵敏的资本市场已作出快速反应:包括红杉中国、百度风投等在内的投资机构已纷纷押注AIGC领域。互联网巨头也在这一领域争相布局,例如,百度有AI作画平台文心一格完成续画,网易有一站式AI音乐创作平台“网易天音”,阿里巴巴旗下有AI在线设计平台Lubanner等。多个国内外爆款应用正纷至沓来。
毋庸置疑,AIGC的未来不可限量,日渐成熟的技术、凸显的降本增效优势以及日益增长的市场需求等因素,都注定其成为新一轮兵家必争之地。
只是,技术之热必须面对法律之冷。当我们寄希望于AIGC成为新的经济增长点的同时,不得不面对一些由此带来的法律问题:AIGC内容是否具有著作权?如何对海量的AIGC进行监管?如何平衡AIGC生产过程中的数据挖掘和权益保护?
AIGC应用规模快速扩增
人工智能的每一次突破,都会引起不小的社会轰动和震撼,并一次次打破人类的认知局限。
“一些人相信,AI可以智慧过人,但大多数人认为达到这一程度还很遥远,我曾经也持相同看法,可能要三五十年甚至更遥远的未来才能见证。显然,现在我改变主意了。”图灵奖得主、被誉为“深度学习之父”的辛顿如是说。
自2016年AlphaGo作为广义上最著名的“棋手”横空出世,到OpenAI击败电竞职业选手,再到从机器人“小冰”出版诗集,以及作家借助AI创作小说段落,人工智能正在不断突破性地进入人类曾经引以为傲的想象力和创造力领域。
2022年底ChatGPT的出圈,更是推动文本类AI渗透于文本生产、智能批阅等应用领域,同时改进训练模型将促进AIGC的发展。ChatGPT被认为“是AIGC领域最顶尖的模型”,AIGC则被认为“有望成为2023年内容生产领域最大变局”。
AIGC通过学习人类的思维方式、查阅挖掘海量素材,能够以低成本高效率的方式生成满足人类差异化需求的内容,为应对人类对数字内容的海量需求和丰富程度提供了有效的内容生产途径。AIGC结合了人工智能和内容创作,能够让机器自动生成高质量、高效率的多种类型的内容,包括图像、视频、音频等。随着AIGC的发展,其应用范围正在逐步扩大,并且已经从简单的文字内容生成发展到智能图片编辑、语音识别和智能写作等。
显然,AIGC或将成为未来内容生成主力,AIGC在内容生成中的渗透率将快速提升,应用规模快速扩增。根据Gartner《2021年预测:人工智能对人类和社会的影响》,到2025年AIGC产生的数据将占所有数据的10%,而该比例在2021年不足1%。按照现有技术成熟度以及现有需求成熟度分析,量子位智库预计,2030年AIGC市场规模将超过万亿人民币。
根据前瞻产业研究院和中关村大数据产业联盟发布的《中国AI数字商业产业展望2021-2025》报告预测,AI数字商业内容的市场规模将从2020年的40亿元,增加到2025年的495亿元,数字内容需求呈指数上升。
著作权法修改或应将AIGC纳入
AIGC的大火,又必然带来一系列法律问题。
“今天AIGC之所以很火,是因为知识生成的边际成本被无限降低,这会产生一系列的版权、专利权等问题。”在近日由中国人民大学高瓴人工智能学院与中国人民大学国家版权贸易基地主办的AIGC内容生态与版权保护论坛上,对外经济贸易大学数字经济与法律创新研究中心执行主任张欣副教授说。
在中国版权协会理事长阎晓宏看来,AI生成内容是不是作品,是其中最核心的问题,“我们现行著作权法所指的作品主体是作者,是公民、法人、社会组织,显然人工智能并不能满足这个要件”。不过,著作权法“并非到一个地方就停止发展了”,是否可以用包容性的态度来看待AIGC,将其纳入未来的著作权法修改中,是一个需要思考的问题。
华中科技大学法学院副院长熊琦教授说,全球范围内都在讨论AIGC的著作权问题,但是司法机关、行政机关、学界对此的主流判断并没有发生实质变化。比如,美国版权办公室发布的操作手册从1973年的第一版到最新的第三版,都认为受著作权法保护的作品一定是来源于“人”的创作。2023年3月底美国版权办公室发布的人工智能参与生成作品的版权登记指南中,仍然明确“必须要有人智力的参与”这一条件。
再如,欧洲顶级的知识产权研究机构德国马克斯·普朗克创新与竞争研究所在2020年发布的关于人工智能和知识产权法的立场声明中,也旗帜鲜明地提出“只有人才能创作作品”。
从这些例子中可以看出,坚持“智力活动只可能来自人”,是近50年来理论和实务界没有改变的认知。但近年来大数据的发展及有关硬件的快速提升,导致深度学习的频率和速度变得很快,就有了今天对AIGC著作权的争议。
熊琦补充说,上述来自实务界的坚持,实际上是谨慎对待谁是人工智能生成内容的作者这一判断,而非一概拒绝将人工智能生成内容视为作品。比如,算法运用和数据训练中由于包含了对生成内容风格和偏好的设定,可以视为与创作的关联,那么人工智能算法的设计者是可以被视为作者的。
浙江垦丁律师事务所主任张延来说,总体上来看,无论是欧盟、美国还是其他一些国家,所持的是一种比较开放的态度,即对于完全AI生成的作品并不是“一竿子打死”,或者认定其不受法律保护,而是为它的权利归属留有空间。同时,对于由人机协作创作出来的作品,部分国家已经认可了如果人在其中确有贡献,能够体现人的智力和知识贡献的话,是可以对其进行著作权保护的。“这些对于下一步进行著作权法的调整,都是有一定帮助的。”
对AIGC监管需要考虑四个方面
对于AIGC如何治理与监管,也是社会各界所关注的问题。
4月,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,对生成式人工智能服务提出了多项规制,强调生成式人工智能产品提供者的责任、突出个人信息的保护、明确向监管部门备案和申报安全评估的硬性要求,及多次重申要从数据源开始确保“生成内容”的真实准确等,开启了中国对生成式人工智能产业的监管之路。
其他国家也都在治理方面有大动作,如欧盟最近成立了ChatGPT治理的特别小组,此前意大利已从个人信息保护层面对ChatGPT进行了封禁。这都意味着,人工智能技术的关键时刻来临,我们治理的关键时刻也随之而来。
张欣认为,对AIGC监管的相关问题需要考虑四个方面:一是监管何时介入,需要考虑技术的负外部性导致的风险程度高低;二是监管对象的选择,是选择技术和服务本身,还是考虑背后的风险与法益;三是做到结果型与过程型监管的平衡;四是考虑基础设施打造和监管生态的完善。
中国政法大学数据法治研究院教授张凌寒认为,生成式人工智能作为一种新型基础设施,是经济社会发展的重要支撑,前期建设需要国家布局规划适度超前发展,后期使用需要强调公共服务的公平性分配,并在此过程中统筹安全与发展。生成式人工智能监管不宜为了服务应用层的信息内容安全,影响其作为基础设施的功能研发,对训练数据、模型开发等施加过多义务。
在对AIGC的治理与监管中,还必须解决数据挖掘的有关争议。“从技术架构中我们发现,数据是非常重要的资料,对整个监管都具有重要意义。”张欣说。
训练数据是人工智能行业最为重要的环节。数据挖掘的合理使用也是当下亟待解决的问题。
中国人民大学未来法治研究院执行院长张吉豫表示,当前迫在眉睫是要在《著作权法实施条例》或合适法律法规中加入数据挖掘的合理使用条款。“按照著作权国际公约,合理使用制度的‘三步检验法’可用于判断某一著作权使用行为是否构成合理使用的一般原则。再退一步,还可以加一个限制条件,‘两年之后还可以重新评估’。现在在发展初期,并没有明确产业的未来前景情况下,加入这样一个合理使用的条款是当务之急,也是必要的内容。”
阎晓宏认为,底层挖掘带来的著作权问题解决目前指向合理使用,但是合理使用也会导致新的矛盾出现,相关问题还需进一步研究。“按照伯尔尼公约合理使用的‘三步检验法’,使用应当是个别的,流通过程中也是个别,并且不损害权利人的获酬。如果全部合理使用,就是事先不征求许可、事后不支付报酬,利益全部归给底层挖掘的人或机构,也不合理。”
来源:法治日报