文\本刊特约撰稿 刘凡
ChatGPT一经面世便打开了人工智能的新大门,一时间由人工智能技术驱动的语言生成、图像生成、声音生成等各类生成式AI(Artificial Intelligence的缩写,意为人工智能)程序层出不穷,将各项具有深度学习能力的生成式AI程序推向了时代的风口。
近日,最为热门的便是声音生成式AI程序和它所孕育出的一大批AI歌手。是什么赋予AI歌手如此精湛的演唱技法?AI歌手是否侵权?我们一起探究。
AI歌手爆火出圈
今年年初在全球最大的视频内容分享平台Youtube上出现了大量AI歌手的翻唱视频,有已故流行音乐天王迈克尔·杰克逊、“猫王”普雷斯利,甚至美国前任总统奥巴马也加入了AI翻唱的热潮。随后国内视频网站也涌现出了一大批训练有素的AI歌手,“AI孙燕姿”“AI周杰伦”“AI林俊杰”等实力唱将相继上线,他们不仅翻唱个人代表作品、流行金曲,甚至《好汉歌》这种风格迥异的作品也不在话下。黄家驹、张国荣等已故歌手也通过这种形式与网友再次相见,引得大量昔日粉丝落泪。AI歌手不仅敬业高产而且唱功了得,流行、摇滚、民谣等各类曲风都能轻松驾驭,甚至专业要求极高的歌剧咏叹调也不在话下,众多网友笑称“期待AI歌手整顿华语乐坛”。
在一众AI歌手中最为优秀的还属“AI孙燕姿”和“AI周杰伦”,截至目前,两位AI歌手已经翻唱了各自代表作《雨天》《遇见》和《半岛铁盒》《爱在西元前》等,还与“AI蔡依林”“AI林俊杰”一起合作演唱了众多作品。视频一经发布,点击量动辄高达百万。目前来看,AI歌手类视频无疑已成为各视频分享网站一大热门。
大数据学习和大模型驱动加持下的两位AI歌手,各种曲风都能够轻松驾驭。这一次,语音数据生成式AI并不仅限于浅尝辄止的模仿,而是通过大量的数据进行深度学习,尽可能地保留歌手本人的声音特色、还原歌手的演唱技巧和表演风格,在部分视频里甚至能够达到以假乱真的效果,甚至在大模型驱动的帮助下,训练人员通过歌手不同时期的嗓音状态和演唱习惯细分出不同年龄段的“AI周杰伦”。
也许是受AI歌手的启迪,近日“歌手AI”竟也横空出世。歌手、音乐制作人陈珊妮在今年3月推出了全新单曲《教我如何做你的爱人》,上线后获得了粉丝和不少乐评人的注意。而令人意想不到的是,陈珊妮在个人社交平台公开发文称:“这是一首由陈珊妮调教,教会AI唱出动人真情的歌。”据悉,在这首歌的AI Vocal中,每一个乐音、每一次吐息,包括所有和声都是由AI完成演唱的。消息一出,舆论哗然。
如此实验性的行为,在华语音乐圈中引发了一定的争议。在陈珊妮看来,自己的这一次实验,反而印证了音乐制作人是无可取代的工作,“如果AI时代必将到来,身为创作人该在意的,或许不是我们是否会被取代,而是我们还可以做些什么。”陈珊妮表示,希望能透过这首歌来探讨“若AI已经能模拟原唱的一切,那么原唱歌手的价值会是什么?”
AI歌手习艺之道
是什么赋予AI歌手如此精湛的演唱技法?So-VITS-SVC便是国语AI歌手的“训练营”。So-VITS-SVC是由Rcell基于VITS、Soft-Vc、Visinger2等一系列项目开发的一款语音数据生成式AI程序。这是一个采用音色转换算法的开源项目,首先需要使用数段音频训练出一个具备目标音色的声学模型,并通过深度学习和语音合成等技术来模拟人类歌手的声音和表演风格。
具体来说,想要训练一位“AI周杰伦”,首先需要获取周杰伦的原始声音数据作为训练素材。这些素材可以通过对现有音乐进行分轨伴奏消除或者使用提取对话的方式,从他的各类视频中获得。然后将这些素材作为目标音色输入到模型中进行训练,得到一个可以生成周杰伦音色的声音数据模型。接下来,需要借助其他大数据学习和大模型驱动工具对目标声音的各项特性进行校对,以提升声音模型的精确度,随后就可以使用这个模型来转换任意音色的歌声,最后再人工介入进行一些后期处理和调校,就可以得到一首由“AI周杰伦”倾情演唱的歌曲了。
而类似的声音数据生成式AI其实我们并非首次接触,在日本及世界各地拥有大量粉丝群体的虚拟偶像初音未来便是最为著名的AI歌手,其“演唱”的歌曲都是使用雅马哈的Vocaloid系列语音合成程序完成的。初音未来的歌曲自发布之初便在各类音乐排行榜上取得了很大的成功。时至今日,初音未来的人气和影响力已经远远超出了虚拟偶像和AI歌手的范畴,已然成为一种文化现象,深刻影响着音乐、时尚、动漫等多个领域。
AI歌手触及诸多法律问题
近期以来,关于人工智能生成内容以假乱真、数据泄露以及侵权的风险受到社会各界的广泛关注。
就目前来看,针对AI歌手是否侵权的讨论大都围绕着著作权保护而展开,《中华人民共和国著作权法》明确:使用他人已经合法录制为录音制品的音乐作品制作录音制品,可以不经著作权人许可,但应当按照规定支付报酬;著作权人声明不许使用的不得使用。AI歌手本身就是借助生成式AI程序,通过他人的合法录音制品“训练”出来的,这算不算侵犯著作权法呢?
AI歌手所生成的并不是某种音色或是某类唱腔,而是具体的歌手个人的声音,我们回归个人本身来看,AI歌手是否损害了这些歌手本尊的人身权益和财产权益?
声音和肖像一样具有非常强烈的个人人身属性,我国《民法典》中要求对声音的保护应当参照肖像权保护进行,而对肖像权的保护,《中华人民共和国民法典》第一百条规定:“公民享有肖像权,未经本人同意,不得以营利为目的使用公民的肖像。”由此来看,AI歌手在未经本人授权允许的情况下生成作品,实属对歌手本人声音的伪造,这无疑是对其人身权益的损害。并且经过大数据训练和深度学习的AI歌手具备完整的音源库,除用于生成音乐外还可用于其他途径,这就可能会造成故意误导、混淆或者是形成假冒他人名义等行为,这些都可能会涉嫌不正当竞争或是其他具有危害性的行为,从而损害歌手本人的人身权益和财产权益。
生成式人工智能有着广泛的应用场景和创新潜力,尽管还存在着知识产权、数据隐私、内容安全等方面的挑战和风险,但促进与发展生成式人工智能是符合国家战略和社会需求的必然选择。需要注意的是,生成式人工智能的社会配套措施还不够完善,因此它需要在法律法规和伦理道德的指导下,合理合法地使用和发展,以保障其正面和积极的作用。