深度报道

站在“风口”的“数字人”是什么人?

这个名叫“班长小艾”的恬美少女,并不是真实的人类,而是元宇宙空间中众多虚拟数字人之一。她不仅从眼神表情到动作举止都做到了活灵活现,甚至连衣服的材质细节都能够完美呈现,最重要的是,她能与真实的人类进行顺畅交流。“我们可以和她进行实时互动,比如向她进行提问或进行其他形式的一些游戏等。”小艾的制造者,数字王国集团虚谷未来科技(北京)公司CEO唐佳娴介绍说。

采访专家:

沈 阳 (清华大学新闻与传播学院教授、“元宇宙文化实验室”主任)

唐佳娴 (数字王国集团虚谷未来科技(北京)公司CEO)

“大家好,我叫班长小艾,是少儿知识分享官,平时我会给小朋友分享非常有趣的科普知识、童话故事和儿童玩具等等!”一个表情灵动、清纯可爱的少女形象出现在大屏幕上,她用清纯甜美的声音向着屏幕外的观众挥手致意并做着自我介绍,还时不时摆动着纱制的裙摆,自信地展示自己曼妙的身姿。

▲超写实虚拟数字人小艾(供图/虚谷未来科技)

这个名叫“班长小艾”的恬美少女,并不是真实的人类,而是元宇宙空间中众多虚拟数字人之一。她不仅从眼神表情到动作举止都做到了活灵活现,甚至连衣服的材质细节都能够完美呈现,最重要的是,她能与真实的人类进行顺畅交流。“我们可以和她进行实时互动,比如向她进行提问或进行其他形式的一些游戏等。”小艾的制造者,数字王国集团虚谷未来科技(北京)公司CEO唐佳娴介绍说。

“小艾,你最擅长什么呀?” 记者提了一个开放式的问题。

“成语接龙!你要不要来比试比试?” 小艾不仅回应了记者的提问,还微笑着向记者发起了挑战。这一瞬间,这个原本由数据代码构成的虚拟形象,似乎拥有了现实世界真实人类拥有的真情实感。

8月3日,北京市经济和信息化局正式公布了《北京市促进数字人产业创新发展行动计划(2022-2025)》,计划提出,北京市数字人产业规模将突破500亿元,初步形成具有互联网3.0特征的技术体系、商业模式和治理机制,成为全国数字人产业创新高地。

对于那些有志于在数字人产业这条全新赛道上发力的企业而言,这部国内首个数字人产业专项支持政策无疑是一次极大鼓舞,但对于接触过虚拟数字世界但却涉猎不深的普通人而言,计划中反复提到的“数字人”这个概念,就显得既熟悉又陌生。

▲2022年9月1日,北京,参观者在中国国际服务贸易交易会首钢园展区拍摄由真人控制的虚拟数字人表演。

“虚拟人”“数字人”“虚拟数字人”都是什么人?

元宇宙空间内,除“数字人”之外,还活跃着“虚拟人”“虚拟数字人”,这些容易混淆的概念不禁让人心生疑惑:这三者之间有什么联系和区别吗?

2022年1月22日,天风证券发布互联网传媒行业深度报告《虚拟数字人:元宇宙的主角破圈而来》中指出:“虚拟人、数字人、虚拟数字人的目标是通过计算机图形学技术 (Computer Graphic,CG)创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。按照各定义特征的要求,数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人。”

“其实目前在行业内,对‘数字人’‘虚拟人’和‘虚拟数字人’ 这些概念,并没有明确的辨析和权威的解释。我们一般认为虚拟数字人或数字人是比较准确的说法。”清华大学新闻与传播学院教授,长期从事 AI 和大数据、元宇宙与虚拟数字人等领域研究的沈阳对记者解释道。广义来看, 用动画制作等各种或传统或现代的手段创造出来、在真实世界不存在的形象,都可以统称为“虚拟人”,而“数字人”通常是运用三维建模等数字化手段制作而成的。对于不要求必须具备交流互动能力时, 数字人、虚拟人、虚拟数字人这三者概念可以认为是等同的。但在严格意义下它们又有细微差别,正如天风证券发布报告中所说:虚拟人的身份是虚构的,现实世界中不存在;数字人强调角色存在于数字世界;虚拟数字人强调虚拟身份和数字化制作特性。

其实,从历史角度来看,虚拟人在某种程度上,更像是数字人的先声或者早期形态。在数字制作手段出现和推广之前,虚拟人这个概念就已经活跃在二维构建的世界中了。

早在上世纪80年代,得益于动漫产业的飞速发展,日本将当年大卖的动画片《超时空要塞》和《太空堡垒》中出现的宇宙歌姬林明美进行一系列包装,并以虚拟歌姬的身份成功出道,还发行了音乐专辑。同时,英国也创作出了一个名为Max Headroom的男性虚拟演员。然而,这些早期虚拟人在先声夺人后,却并未在相应技术的支撑下发展下去。

无论是林明美还是Max Headroom,这些颇具科幻色彩的虚拟形象,却都是由手工绘制或者真人特效化妆这类相当原始的手段来实现的。对比真实世界里的人,这类早期虚拟人更像是二维动画的衍生品,并没有给人们带来多少冲破现实的科技感。

直到信息时代来临,以CG和动作捕捉技术为代表的虚拟技术得到广泛应用,虚拟人才终于插上了数字化的翅膀,从古板的二维手绘动画跨入了三维建模世界中,得到了更加立体更贴近真人的呈现,并最先出现在电影银幕上那些华彩玄奇的科幻镜头中。

比如我们熟知的《魔戒》中的咕噜、《哈利·波特》系列电影中的小精灵多比,《加勒比海盗》中的章鱼人等虚拟形象,都是通过捕捉和采集真人身上的动作与表情,通过CG后期处理和渲染,在视觉上让那些精灵怪兽获得和真人一样的表现力,以满足观众对“逼真”效果的追求。

除了形象与动作逼真外,随着AI技术与深度学习算法技术的兴起,虚拟人又被进一步赋予了智能化的内涵,除了模仿人类的行为外,还获得了与真人交互的能力。技术迭代发展到这一步,无论是虚拟人、数字人还是虚拟数字人,这些概念实际上已经难分彼此:诞生于数字世界的人物,从制作技术上而言可以被称为“数字人”,同时,相对于真实的物理世界,数字世界也是虚拟的存在,存在于这个世界的数字人也是“虚拟人”。

相对于学界对学术概念探究的细致入微,产业界则往往是实践先行,“无论是虚拟人还是数字人,只是叫法不同而已,本质上是概念的区分,而非纯技术领域的差别。”唐佳娴说。

从活灵活现到真假莫辨,

虚拟数字人是怎样炼成的?

本质而言,虚拟数字人其实就是对真人的一种模拟形态,在具体制作过程中,数字人需要以人的各个位面作为参照,做到形神兼备,才能呈现出“人”的效果。人是兼具自然属性和社会属性的存在,数字人首先要从模仿人的自然属性入手,这里既包含了人的身体,也囊括了人的思想。

身体是人存在的物质基础,模拟真人身体是呈现虚拟人效果的第一步。在这里,技术人员需要依靠一系列复杂的建模技术来实现虚拟数字人从静态到动态的跃迁。

首先要对人的静态身体进行建模,目前业界最广泛的应用方式是通过3D建模软件塑造出人的静态3D模型,实现各种高低细节效果。考虑到人体外形本身就是复杂的不规则体,肢体活动又复杂多变,这种方式非常考验建模人员的经验与手感,人工建模的效率是不可控的。因此,在3D建模之外,近年来又逐步兴起了仪器采集建模和自动化建模这两种新方法,前者是通过仪器扫描的方式来将采集的人体信息转换为数字信号,完成人物的几何建模。后者则通过一套AI系统来直接生成人体结构。这两种新方式都极大降低了建模的时间成本,使虚拟数字人的大规模生产成为可能。

有了静态的人体,如何让人体各部位活动起来,赋予虚拟数字人生命的气息?

第一步是要进行骨骼绑定,即在虚拟数字人身体上涉及基本活动的关键部分进行打点,大到骨骼、关节,小到眉毛、眼角,这些遍布全身的“点”将成为驱动虚拟数字人做出各种动作与表情的关键。

第二步就是在绑定基础上,让虚拟数字人真正动起来,现在更多的是靠驱动技术来控制动作和表情,根据外界的信号来实现实时反馈。这就需要通过一系列复杂的动作捕捉技术来捕捉真人动作细节,将之赋予虚拟数字人,实现从“静”到“动”的效果。

当然,无论在技术上将虚拟数字人的身体做得多么惟妙惟肖,缺少了头脑就只能作为一只高科技的提线木偶而存在。这就要赋予虚拟数字人真人一样的“灵魂”,借助各种复杂的当代人工智能技术(比如计算机视觉技术、语音识别与合成技术等),人们能够使数字人获得看到、听见、说话等基础感知,在此基础上还能获得一定的认知、判断甚至创造能力。

随着技术的不断突破,未来的数字人将具备更为复杂的思想,更为拟人的性格,甚至与人类产生共情,从单纯的活灵活现,变得真假莫辨。

“举杯邀明月,对影成三人”

虚拟数字人有什么用?

如果算上二维动画时代创造的那些古早味虚拟形象,数字人整个发展历史不过40年。

实际上,发挥自己的想象,在现实世界中创造出一个虚拟的人,这种想法其实早在古代就出现在当时人们的脑海中。

比如唐朝诗人李白的“举杯邀明月,对影成三人”,在明月和自己之外,这位大诗人又将自己的影子想象成一起开怀畅饮的友人,如此诗境,令人陶醉。

“其实人类一直都希望在思想世界中呈现出数字人。” 沈阳对记者说道,“如果要把‘对影成三人’这种场景具象化,表现诗人的这样一种艺术境界,在现代我们就需要借助数字人来实现。”

可以想见,倘若李白活在当代,在现实世界深感 “花间一壶酒、独酌无相亲”的孤寂时,他可以与数字人一同把酒言欢,一起寄情山水,一块儿畅谈古今,这个虚拟数字人可以通过AR方式呈现,依靠CG渲染技术表现出与真人一样的外形与动作,通过AI技术获得与人交互的能力,最大程度上满足了李白“以酒会友”的需求—而这其实正体现了数字人当前最广泛的应用场景:承担人类在真实世界中的部分工作。

“虚拟数字人第一个生产力的体现,就是替代人在真实世界中创造精神世界的一部分劳动。” 沈阳概括,“比如电影本身就是一个精神世界的产品,未来获得演员授权的数字人可以替代一部分表演工作。”作为数字人最早发轫的应用场景,当下的电影制作中,以CG技术创造的高写实人物或虚拟角色已经广泛应用于后期特效,可以呈现真实世界中无法企及的炫酷大场面。而在未来,AI技术加持下的数字人演员可能会在相当程度上替代真人演员的工作,从而极大降低电影全周期的制作成本。而在唐佳娴看来,虚拟数字人最早出现在电影《返老还童》中,替代真人演员无法拍摄的工作任务。后来延至逝者复活,乃至“虚拟偶像”的创造及商业发展。而在当前,通过AI的加持,虚拟数字人可以替代一些重复性、功能性的真人服务,甚至能实现“一对一”的贴身虚拟陪伴服务。

▲在江苏卫视今年年初的跨年演唱会上,通过数字技术“复活”的一代歌星邓丽君登台献唱,惊艳世人 (供图/虚谷未来科技)

目前虚拟数字人早已从影视制作和游戏中走出来,不断嵌入到现实世界生活的方方面面。“比如虚拟偶像、虚拟明星、虚拟主播和主持人,这些都是偏娱乐方向的。另外,目前出现的虚拟老师、虚拟导游、虚拟解说等等,则是偏服务方向的。”唐佳娴介绍说。

在主播经济浪潮的推动下,不少虚拟数字人已进军主播或主持行业,与真人或相互合作,或同台竞技。

▲2021年,虚拟美妆博主“柳夜熙”横空出世 , 一夜之间在短视频平台吸粉百万

在计算机技术的加持下,目前虚拟数字人的制作已经实现了从建模、驱动、渲染、剪辑和合成等生产步骤的实时化和智能化产出,就如同流水线上的产品一样能够大规模生产,虽然在语言、动作等方面的精细程度上存在很多短板,但相比真人主持与主播,虚拟数字人却有更宽广的发挥空间:他们可以以卡通萌宠的形象示人,也可以是根据真人主播真身复刻的数字分身,同时也可以是在真人基础上进行艺术创作的超写实形象(文章开头提到的小艾,就属于超写实虚拟数字人),在降低制作成本的同时,极大拓展了内容创作的想象空间。

除此之外,数字人也在相当程度上开始参与现实世界的服务工作中,从偶像、主播等远在云端的娱乐领域,向日常生活中的老师、咨询专家、导游等服务类角色不断贴近,并进一步开始担负起普通人的日常陪伴工作,实现人类社会复杂而敏感的情感寄托。

沈阳所领导的清华大学元宇宙文化实验室不仅是国内高校最早一批成立的元宇宙实验室,更是国内首个带有文化属性的元宇宙实验室,其科研团队目前也在朝着这个方向重点攻关:“我们研究成果的重点应用场景之一就是把过世亲人以虚拟数字人形式还原出来,让他们以数字生命方式重获新生。” 可以想见,这种数字人的呈现方式,对于思念逝者的人而言,将是一种莫大的精神抚慰。而“代码为骨、渲染为皮”的数字人,未来或许会成为整个人类社会不可或缺的参与者。

虚拟数字人和元宇宙是何种关系?

无论是娱乐方向的虚拟主播或偶像,还是服务日常生活和情感照顾的虚拟老师、专家等,无论这些数字人制作得多么惟妙惟肖,多么灵动活现,在AI技术加持下多么伶牙俐齿,但终究还是停留在“让他们介入到我们的世界”这一方式上。而我们知道,数字人诞生于平行于现实的虚拟世界中,如果我们把方向逆转,跟着数字人的脚步,探访他们所处的世界,将会是一种怎样的体验呢?

这就不得不提近来被持续热议的新概念—元宇宙。这个整合了多种互联网技术而形成的虚拟社会形态,在登上舞台之初,就与数字人有着千丝万缕的渊源。

1992年,美国著名的赛博朋克流科幻作家尼尔·斯蒂芬森在其作品《雪崩》中首次提到了元宇宙概念,同时也在小说中提到了名为Avatar的虚拟化身概念,可以理解为一种虚拟数字人。在小说构建的数字空间元宇宙中,人们通过各自的“Avatar”化身冲破地理阻隔,相遇并交往。而在当下学界和产业界努力推动和构建的元宇宙世界中,虚拟数字人就是人类接触元宇宙的最基本方式和抓手。

▲元宇宙以5G/6G、云计算、区块链、大数据等为底层支撑,并以人工智能、数字孪生、VR/AR 等为映射、动力与通道,同时融合人的思维意志、情感想象等主观意识,连接了物理世界与数字世界,形成虚实共生的“新世界”(图片来源 /《元宇宙——概念研究与体系构想》)

“我们构建一个元宇宙空间,这个空间做得好与不好的标准,不在于本身做得有多仿真,而是在于我们人类能不能沉浸在这个虚拟场景中,产生一种共情。而这就需要借助虚拟数字人”,沈阳这样解释数字人与元宇宙之间存在的高度关联性。

所谓人是宇宙的主体,映射到元宇宙的世界也是如此—数字人才是元宇宙的主体。在沈阳看来,除了能在真实世界替代人去创造精神世界的产品,元宇宙中的数字人同样能在元宇宙中替代人的数字劳动,“比如你在元宇宙中参加一个虚拟会议,会上的一些仪式性的工作就可以交由数字人来承担,这也是他生产力的体现。”

唐佳娴则认为:“元宇宙实际上就是一个数字化空间,构成这个空间的三要素就是:人、物、场。”在她看来,人就是数字人,物是存在于元宇宙中的各种物品,场就是元宇宙生态中构建起的各种场景及其关系。而其中“人”是主角,元宇宙中的“物”和“场”是以人为中心,为“人”服务的。

作为现实世界的映射,元宇宙绝非真实世界一比一的复刻,而是以数字化和网络的方式,呈现另一种环境生态的平行世界。存在于这个世界的数字人,除了具备人的形象,还需要有“人”的性格、行为特征,更重要的是要有人的交互能力。

这其实很容易联想起那些经典的网络游戏的内在逻辑—你以某个虚拟角色身份参与到具体场景中,以真人驱动的方式操纵场景中的虚拟数字人,和场景中其他或真人驱动或AI驱动的角色进行互动。只是在元宇宙生态中,你不再是单纯围绕游戏的故事剧本推进剧情走向,只是和那些不同的数字人进行组队或者相互战斗,而是和他们产生一系列复杂的社会交往行为,比如逛街、购物、看展出、郊游等等。元宇宙里的虚拟数字人就相当于真人在虚拟世界里的一个数字分身。

“人们在现实生活中只能做自己,但人本身是有实现多元性的梦想和需求的,在虚拟世界里普通人可以穿越多维时、空做不一样的多元自我,体验丰富奇幻的生活与世界。”唐佳娴说。

虚拟数字人面临哪些伦理和法律问题?

所谓有人的地方就有江湖,有江湖的地方就有恩怨。无论是有数字人参与的现实社会,还是以数字人为主体的元宇宙社会,都无可避免地会遇到矛盾与冲突,也就必然会涉及到各种各样的问题。

首先是身份问题,每个现实中的人在介入元宇宙的世界中时都拥有属于自己的数字身份识别,但这套身份识别不是现实世界中的身份证、护照等具体的证件,也不是社交网络上的ID号码。

“在元宇宙中,数字身份的具象化就是数字人。”沈阳解释道,“元宇宙时代,我不再通过具体的ID号来识别你,而是通过虚拟数字人的形貌特征来识别你,形貌背后映射的是唯一的数字编码,这就是DID(Decentralized Identifier),即分布式数字身份。” 而分布式数字身份当下也面临着数据安全和网络安全等挑战,背后也牵涉到个人隐私和伦理道德等一系列问题。

其次,无论是现实世界还是元宇宙,社会想要稳定运行,就需要有相应的秩序,而秩序背后则需要有法律法规作为支撑。

数字人形成时间并不长,元宇宙更是一个全新的概念,但发展到现在已经开始出现相应的法律问题,比如在2021年,元宇宙概念刚刚兴起的时候,就出现了女性用户在虚拟世界中受到骚扰,而引发法律诉讼的事件。而在今年年初,我国互联网信息办公室就颇具前瞻性地发布了《互联网信息服务深度合成管理规定》(征求意见稿),对于数字人可能涉及的违法和侵权认定,做了初步的法律探索。

“虽然只是征求意见稿,但这显然是一个非常超前的管理规定。虽然目前数字人还不普及,但相应的法规需要跟上。” 沈阳表示。

尽管有来自伦理、法律和制度层面的隐性挑战,但目前面临的主要问题还是来自技术层面。

唐佳娴认为,当下来看,虚拟数字人无法完全替代真人的全部工作,综合体验感还有待提升。不过对于数字人的未来,她依然非常乐观:“我相信在未来,数字人能够实现快速生产,同时随着AI技术的不断更新,虚拟数字人的形象和思维学习都会飞速发展,相应的制作成本也会持续降低。”

具体到我国,虚拟数字人在近两年得到了长足发展,在元宇宙概念的加持下,应用场景开始变得丰富多样起来,但面临的技术难题依然不可忽视。

“我国虚拟数字人的底层制作引擎目前看仍有待加强。”沈阳表示,“AI技术是虚拟数字人的灵魂,理论与技术上需要更多的创新。” 对数字人的未来,沈阳也充满了期待:“我国数字人的应用场景十分丰富,在直播带货和短视频等领域位居世界第一,同时拥有相应的产业政策作支撑,此外还有深厚的传统文化作为依托,中国未来的虚拟数字人发展将别具特色。”

撰文/记者 段然 编辑/吉菁菁

图源/视觉中国(除署名外)

出品:科普中央厨房

监制:北京科技报 | 北科传媒

关键词

24快报
JSON抓取失败