虚拟数字人有多热,看看南开大学就知道了。
在南开大学校庆日暨南开大学新闻与传播学院成立一周年之际,中国首家元宇宙新闻与传播学院10月17日在南开大学推出,根据南开大学新闻与传播学院秀山堂现实物理空间虚拟复制的数字空间正式上线。
公开数据显示,截至今年9月,国内虚拟数字人赛道投融资金额已超过去年,达到24.9亿元。
2021年虚拟数字人相关企业投融资金额约为19.71亿元,而在2015年这一统计数字仅为0.33亿元,6年间复合增长率达到97.71%。
各大科技巨头也不约而同选择在虚拟人领域“秀肌肉”:国外的Meta、微软,国内的腾讯、阿里、百度、快手、网易,均投入重金布局。
甚至于虚拟数字人的跨界行为也已经开始。
近期的国际时装周虚拟秀中,一群穿着时尚的虚拟数字人走上了舞台,而这支由虚拟数字人组成的模特队伍正是由百度AI数字人希加加领队。
百度数字人希加加身穿安踏最新发布虚拟时装,领衔走秀开启的第一次T台秀。
元宇宙走秀给时尚行业带来了诸多想象,也让更多人感受到了AI数字人+虚拟场景+品牌IP的可能性。
虚拟数字人将会成为元宇宙的标配吗?
互联网大厂们为何纷纷重金押注虚拟数字人?
虚拟数字人又面对怎样的难题与挑战呢?
对此,澎湃新闻记者吴宇欣和书乐进行了一番交流,贫道以为:
虚拟数字人看似柔弱,其实浑身长满“肌肉”,正在成为互联网大厂的技术实力形象代言人。
目前而言,虚拟数字人在时尚、直播领域目前更接近于一个噱头。
但,虚拟人某种意义上是各大互联网科技厂商展示肌肉的一个集中呈现物,即内容创造、人工智能、动作捕捉和各种与之相关的技术的融汇。
本质上,虚拟人不诞生新技术,而是用受众最容易理解的方式,展示黑科技成果。
此前和时尚品牌合作进入时装秀场,和更多合作伙伴一起开启直播,也是同样的一种集合人工智能、形象设计、文创内容的“亮肌肉”表现,时尚潮流行业和互联网公司都需要这样的跨界来达成一种展示。
不过据此认为虚拟数字人的发展已经可以商用,这过于乐观。
虚拟人现在除了虚拟歌姬这个发展了十余年,商业化模式和技术准备(声源库技术和3D成像技术)比较完备外,目前的虚拟人还大体是一个木偶,需要人工在内容(演艺节目到动作、歌曲创作)上进行全面设定,人工智能的成分特别是人机互动的效果,还没有真正走向泛受众体验层面。
看似永不坍塌人设的虚拟人,目前有两类:
一类是AI驱动,类似皮洛曹,本身是人工智能算法集合而成,进而达成某种自主,如华智冰、微软小冰、小爱同学,其形象只是一种外在呈。
另一种是声源库驱动,类似木偶,以声源库为底本,有内容创作者为其创作从歌曲到动作乃至各种内容,形成虚拟偶像的效果。
无论是哪一类虚拟人,其底层都是人力驱动,即有人工智能技术人员、内容创作人员和各种后台支持人员来为其有效展示“魅力”提供支撑。
最大的问题:有画皮、没画魂
而当下最大的问题也就在于内容支撑依然无力,整个产业中用来呈现的虚拟人依然如同“画皮”,没有“画魂”。
事实上,虚拟偶像布局在2017年到2018年就有过一次大规模尝试、然后降温。
而在2021年众多名人明星人设翻车后又开始爆发,其本质是科技互联网行业习惯性的跟风老毛病,去年的爆发也有元宇宙和永不翻车人设的催化。
此外,互联网大厂,也有提前占子和试错积累经验的意味。
毕竟是一个风口,试试没错,但大多也只是浅尝即止,不是重点突破方向。
据艾媒咨询预测,虚拟人带动的国内产业市场规模将在2025年达到6402.7亿元。
技术的跃进也正在发生。
在近日召开的Meta Connect大会上,扎克伯格介绍了更善于捕捉眯眼、睁眼等物理交互细节的新一代虚拟数字人。
未来,逼真的虚拟数字人可以在Meta的所有APP(包括Facebook、Instagram和WhatsApp)以及VR中运用和迁移。
同时,虚拟数字人的斩获看上去很美。
在短视频、微博等社交平台,聚集了更多虚拟数字人博主。
去年10月出道的虚拟人美妆博主柳夜熙,一场子鼠妆仿妆挑战吸引超1482.3万人观看。
虚拟人网红AYAYI频频为服饰和奢侈品牌代言,并在微博晒出入职阿里的员工卡。
与此同时,各大品牌的虚拟代言人形象也纷纷亮相。
在文娱、电商方面,虚拟数字人正在创造商业价值。大批虚拟人主播已经上岗带货。
乐华娱乐和字节跳动联合推出的虚拟偶像女团A-SOUL,去年11月在B站的直播收入已达249万元。
2021年7月,虚拟嘻哈歌手HAJIANG哈酱正式签约华纳音乐旗下亚洲电子音乐厂牌Whet Records,成为其首位虚拟数字艺术家。
智障怎么破?创作怎么整?
但从产业层面而言,数字人在应用上,主要问题有三:
其一是内容输出依然需要人工完成,即依靠声音库生成俄非人工智能角度的虚拟数字人(如洛天依)演绎的大量内容创作者来进行歌曲创作、动作捕捉,而这并不比配合现实艺人的演艺简单。
其二是智能呈现还“智障”,即人工智能向的虚拟数字人,尽管可以进行有效问答,亦可针对特定内容(如高考作文)进行创作,但大多只有特长,而无法如真人一般“德智体”全面发展,触及设定盲点就会抓瞎。
其三是场景展示有局限,除了通过3D成像登上舞台、演唱会,通过直播短视频进行演艺外,更多的场景仍在拓展中,如成为车载导航的虚拟数字人,在驾驶过程中,进行人机交互的展示意义,和智能音箱并无二致,形象呈现也无实际意义。
此外,仅仅看到营销成本降低,却无视虚拟数字人的研发、维护和升级成本,都是将虚拟人看作是一种低成本营销和蹭热点手段的偏见。
毕竟,AI驱动的虚拟人,整体还在突破智障的技术研发阶段,成本是海量的。
而声源库驱动的木偶,表面成本看似不高,但内容原创成本不低,且真正实景展示(如演唱会),所需要不断解锁和升维的成像技术也必然是巨大的开销。
仅仅看个别虚拟人“疯狂赚钱”的战绩,难以掩盖二八定律下更多虚拟人被世人无视的尴尬。
因此,整体成本上,虚拟人远比让练习生成为偶像更贵,事实上要么互联网大厂才能持续的烧钱游戏,要么是极少数创意者借助既有程序而意外打开的星图。
对于大众而言,时间、精力、金钱都不足以进入这个赛道,只能成为看客,且目前并无多少可看的虚拟人,或许真正的大众观赏要在元宇宙中沉浸式打开。
作者 张书乐,人民网、人民邮电报专栏作者,中经传媒智库专家,资深TMT产业评论人