“虚拟数字人”是一个全新的概念,目前,它还处于概念形成阶段,仍处于技术实现和应用阶段。近期,由中国科技大学与百度联合打造的“新声”虚拟数字人正式上线。据了解,新声虚拟数字人具备虚拟形象、人工智能、大数据分析等多种技术,可实现 AI系统和真人形象无缝结合,具备自然语言理解、语音合成、手势识别等多种功能,并可与人类产生情感共鸣。同时,其还具备多维视角下的人工智能,可以精准感知用户动作、表情、眼神等关键特征,通过大数据分析来增强用户体验。1、什么是虚拟数字人?
从字面上来看,“虚拟数字人”的概念和内涵就很好理解了。目前,“虚拟数字人”主要可以分为两类:一类是虚拟形象,即虚拟人物,如计算机动画师、虚拟歌手等;另一类是数字人(包括虚拟偶像),目前虚拟人物比较常见比如 NBA球星乔丹、歌手王菲、著名主持人董卿等。虚拟数字人可分为实体数字人和虚拟人物两类:虚拟形象以真人形象为核心(比如微软 Azure虚拟形象、谷歌 Epic Pencil)进行构建;而虚拟人物则是以数字技术为核心(比如百度新声)进行构建。据悉,在百度“新声”中,数字人主要包含以下三大部分:第一步是基于大数据分析构建真实数字人形象;第二步是通过 AI技术构建虚拟数字人形象;第三步形成虚拟数字人形象,并与之进行深度互动;最后将互动生成虚拟数字人形象进行应用产品开发。“新声”虚拟数字人可在与真实数字人完全相同、具有同样情感、动作、表情等方面表现出类似真品一样准确、自然、逼真、充满情感与乐趣并具有超强模仿能力,能够与之进行情感交流与互动等内容输出等服务内容来满足客户各种需求,从而为客户带来更高品质、更个性化、更加沉浸式以及更加人性化、个性化、多元化、智能化等服务体验。
2、它有什么功能?
据介绍,新声虚拟数字人在“说话”方面,其主要分为两部分:一是多维视角下的人工智能系统;二是多维视角下的多维度人工智能系统。该系统具有“感知智能、交互智能”四大核心功能。通过大数据分析、语音识别、人机交互、情感共鸣等多种技术实现与真人形象的无缝融合;同时可以与人类产生情感共鸣。
3、“新声”的“新声”是什么?
“新声”是指智能的交互语音、虚拟人与 AI系统的交互技术、声音合成技术和 AI学习优化技术。智能交互语音:新声虚拟数字人具备自然语言理解、对话及手势识别等多种技术。通过基于百度大脑的自然语言理解系统的学习算法和对音频数据进行深度学习,达到识别自然语言的目的。语音合成:将人工智能系统提供给虚拟数字人的语音内容通过深度学习算法将语音转化为高品质、情感丰富、可听性强的音频合成内容。
4、未来,虚拟数字人是否可以与真人“互动”?
随着人工智能、大数据等技术的发展,未来 VR技术将更多地应用到人们的日常生活中,与真人进行互动。比如在生活中帮助人们完成一些日常事务和任务,虚拟数字人可以与其进行交流、互动。但这仅限于 AR等设备运用的场景,未来可以实现更多应用场景,比如为人们提供数字服务、为公共服务提供数字化支撑等。未来的虚拟数字人可以与真人进行互动,或作为一种新的工作方式出现在人们生活中。比如在社交媒体上活跃起来、与身边人进行互动、进行虚拟直播、与直播平台进行合作等。
5、“新声”为我们带来了哪些帮助?
“新声”虚拟数字人的出现与运行,是人工智能技术在 AR领域的重要应用。据了解,“新声”虚拟数字人在 AR领域中主要的应用包括:虚拟人物形象制作、人物形象合成和声纹识别。此外,用户还可以通过新声虚拟人来体验语音识别、手势控制等功能,甚至实现跨地域实时互动交流。
声明:以上内容为汉全软件作者本人原创,未经作者本人同意,禁止转载,否则将追究相关法律责任