1月17日,由中国信息通信研究院(以下简称“中国信通院”)主办的主题为“智创内容,元启未来”元宇宙创新探索论坛在线上顺利召开。会上,中国信通院发布了第二批数字人产品评测结果,声网数字人在技术能力、工程化能力、安全保障等三方面顺利通过评测,成为拥有权威认证的数字人厂商之一。
本次中国信通院发起的数字人系统基础能力评测代表业界顶尖技术水准,评测依据《数字人系统基础能力要求及评估方法》标准开展,该标准和全球首创的数字人国际标准从属于同一标准体系,是目前数字人领域唯一受到认可的系列标准。数字人系统基础能力评测共计48个测试项,分别从基础技术能力、基础工程化能力、基础安全保障能力等三大维度对声网数字人进行全面评估,最终声网顺利通过全部测试,成为数字人系统基础能力评测证书获得者。
声网数字人产品是为开发者提供的一套 PaaS 产品,帮助开发者快速实现在社交娱乐、教育、金融、VR 和 AR 硬件穿戴设备、会议等场景的沉浸式体验,降低开发门槛,助力开发者迈向元宇宙时代。
在元宇宙概念持续火热的趋势下,用户对虚拟场景的沉浸式体验有了更高的需求。而声网虚拟人主要帮助企业快速搭建两种场景:一是 3D 沉浸式空间,主要应用于虚拟社交交友场景、大型虚拟演唱会、大型发布会等,在3D 沉浸式空间里可以支持万人同场与多人控制,可以轻松实现用户通过虚拟人化身在场景内的位置移动与实时音视频通话。
尤其在沉浸感体验上,声网的 3D 空间音频可以帮助用户虚拟人在空间中重现“现实空间质感”,当用户操作 Avatar 在虚拟场景里移动时,听到的音效会根据 Avatar 的头部及脸部朝向、声源角度和距离不同而变化,完美模拟现实听觉,增强真实互动感。
二是虚拟人特写,更多地被应用于各类直播、虚拟社交交友、银行客服、主题演讲嘉宾特写等,支持单人和多人异地同时控制。
另外,为了更加便捷地供开发者使用,声网虚拟人提供跨平台 SDK,开发者可以快速调用虚拟人形象定义功能比 如捏脸、换装等,也可以自主选择接入调用虚拟人的 AI 驱动功能,比如面捕驱动。声网虚拟人产品还充分考虑到 3D 渲染原生适配的能力,支持开发者通过 SDK 接口调用,直接通过原生开发定义界面 UI、界面交互比如手势拖动、手势放大缩小与旋转、控制人物朝向和位置等。
作为全球实时互动领域的开创者和领导者,声网虚拟人产品最核心的优势还主要体现在超低延迟的位置同步、表情和动作参数同步、音视频同步,以及高并发的稳定处理。这源于声网的RTM 2.0产品,可以让实时消息做到全球范围内平均不⾼于 100ms 、最低达 30ms 传输延迟,满⾜企业元宇宙应⽤场景中对于实时性的严苛要求,给用户打造身临其境的沉浸式体验。