数字人

对不起,你的虚拟人同事又“迟到”了

当下,元宇宙概念席卷各行各业,不仅推动了技术的跨行业融合,也推动技术渗透到日常生活之中,在带来前所未有的数字化交互体验的同时,也在工作生产之中带来了效率突破提升,当然,这一切都仅限于元宇宙企业宣传时中的PPT中。

当下,元宇宙概念席卷各行各业,不仅推动了技术的跨行业融合,也推动技术渗透到日常生活之中,在带来前所未有的数字化交互体验的同时,也在工作生产之中带来了效率突破提升,当然,这一切都仅限于元宇宙企业宣传时中的PPT中。

以元宇宙“数字化身”基础技术——虚拟人技术为例(虚拟人也称数字人,本质是以数字形式存在的,具有人类的外观、行为、甚至是思想特征的虚拟形象),尽管其以肉眼可见的速度快速落地(例如现在短视频中各种虚拟女团、男团),但是其体现的价值,与此前在各种白皮书中提到的生产力赋能相差甚远,堪比“康师傅包装上的图片仅供参考”,那么虚拟人产业的真实发展水平如何呢?

01 虚拟人or神话人?

数字虚拟人的广义定义为数字化外形的虚拟人物 ,具有“虚拟”(存在于非物理世界中)+“数字”(由计算机图形学、图形染、动作捕捉、深度学习、语音合成等计算机手段创造及使用)+“人”(具有多重人类特征,如外貌、人类表演/交互能力等)的综合产物 , 打破物理界限提供拟人服务与体验是其核心价值。

从驱动技术角度来看,交互型数字虚拟人可分为真人和计算机驱动两种类型。真人驱动型数字虚拟人以真人为核心,用户可以通过3D建模、动作捕捉技术、渲染等技术,在网络上形成真人的虚拟化身,在动作灵活度、互动效果等方面有明显优势,一方面能够在影视内容的创作中减低生产成本,为影视行业降低门槛,推动影视级内容向消费级转化。另一方面则多用于虚拟偶像、重要直播中,帮助数字虚拟人完成大型直播、现场路演等互动性、碎片化活动。

而 计算机驱动型数字虚拟人,以深度学习技术为主,本质上还是算法,但会拥有一个定制化的虚拟外表。计算驱动的数字虚拟人最终效果受到语音合成(语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯)、NLP技术(与使用者的语言交互是否顺畅、是否能够理解使用者需求)、语音识别(能否准确识别使用者需求)等技术的共同影响 ,其最大好处就是成本足够低。

正因为虚拟人本质上与工业革命过程中机械代替人工提高生产力是一样的(理论上),所以很多互联网企业都加入到开发开放虚拟人行列,例如2016年搜狗公司就曾与新华社联合推出了 世界首位全仿 真智能AI主持人”新小浩”,此后百度也与浦发银行联合推出了浦发银行数字员工“小浦”,甚至 万科数字虚拟员工“崔筱盼” 还 获得2021年万科总部最佳新人奖 (天九共享集团“九妹”也被集团评为“金牌主播”),虚拟人似乎得到了企业们的认可。

02 被神话的虚拟人

事实上,虚拟人已陷入“职业瓶颈期”。

目前,全球虚拟人的应用场景主要有4个方向,分别为虚拟偶像、虚拟分身、虚拟助手与多模态助手。其中虚拟偶像是最常见的场景,例如初音未来、洛天依等初代二次元虚拟偶像凭借CG技术合成+雅马哈VOCALOID系软件合成声音,早在2010年前后就已诞生,而其呈现形式和商业 化场景随技术进步持续丰富 。近些年,字节跳动及乐华娱乐于2020年推出虚拟偶像团体ASOUL,燃麦科技于2021推出虚拟超写实数字人 AYAYI、创壹科技于2021年推出超写实虚拟UP主柳叶熙 ,随着虚拟人技术的发展,在演艺活动、直播带货、直播 打赏及商业代言 中看见虚拟人的几率也越来越高了。

其次是虚拟助手场景,这一类场景下对虚拟人的形象 精度、交互要求、人设打造均不高 ,如新闻播报主持、文旅导览导航、金融客服、教育、产品说明等场景(前面提到的多个“优秀员工也属于这类”),在对交互要求相对简单的场景下已经开始代替人类工作了,不过在中国移动、淘宝这些国民产品中,虚拟客服的跳出率相当之高,基本上都是直接要求人工客服,由此也反映出虚拟员工的不合格。

剩下的就是虚拟分身场景与多模态助手场景,相对而言,虚拟分身场景目前的应用叫多模态助手场景更多一些,前者在元宇宙社交与VR游戏中应用较多,后者由于对对用户系统个性化、 虚拟人拟人程度、交互能力要求极高 (一般用于提供顾问、关怀、陪伴、事务处理等服务),所以到目前为止仍是科技巨头的玩具,且基本未有落地。

可以看到,在虚拟人的四大应用场景中,目前除了虚拟偶像场景“虚拟主播”已开始适应工作之外,其它场景虚拟人还不能成为一个合格的打工人,虚拟人困在直播间里。

本文来自微信公众号“Techsoho”(ID:scilabs),作者:Light

关键词

相关阅读

24快报
JSON抓取失败