数字人

拓元智慧全栈AI技术 为虚拟数智人应用加码

元宇宙概念爆火后,作为现实与元宇宙场景连接的重要“媒介”之一虚拟人以主角身份再次破圈。虚拟主播、虚拟教师、虚拟客服、虚拟导游等各类虚拟人物形象也愈发立体和全面地展示在我们的生活中,虚拟人普适化看似又进了一步。

元宇宙概念爆火后,作为现实与元宇宙场景连接的重要“媒介”之一虚拟人以主角身份再次破圈。虚拟主播、虚拟教师、虚拟客服、虚拟导游等各类虚拟人物形象也愈发立体和全面地展示在我们的生活中,虚拟人普适化看似又进了一步。然而,这些倍受追捧的虚拟人多以CG技术加持,低智能的驱动能力、局限的推广应用、高额的造价却让更多受众望而却步。

今年8月,完成Pre-A轮千万元融资的拓元智慧,利用其全栈AI技术,推出了2D真人复刻服务,并通过在垂直领域创建具备推理和认知能力的数智人大脑,打造出低门槛、可规模化落地的数智人解决方案,为大众用户提供在虚实融合世界的分身和交互中介,使其成为新的连接及生活方式。

全栈AI技术 1:1还原真人形象和声音

《2022虚拟人产业发展白皮书》指出,决定2D真人数智人高真实度还原的核心技术是各类驱动算法设计和模型训练,数据训练的质量将决定数智人内容产出的效果。拓元智慧作为一家具备原创领先技术的虚拟数智人技术及应用服务商,在虚拟数智人核心技术领域积极布局、持续创新突破,其核心团队在自监督学习、知识及因果推理、多模态内容生成等关键技术板块积淀了多年深厚的技术基础。

通过原创的人体及人脸三维重建、语义/情感关联的表情和动作生成、情感化/风格化语音合成等全栈AI技术能力,拓元智慧能根据真人出镜录制的短暂音视频内容,完成人物形象、声音复刻及还原,实现媲美真人的宇宙元分身。

在形象复刻方面,一是采用人脸三维结构重建模型,训练人物表情、口型和人脸形象,渲染出生动、灵活的脸部肌肉和表情;二是采用肢体三维结构重塑,通过肢体可驱动引擎完成穿着渲染模块和虚实环境交互对齐。在声音合成方面,则是采用高保真多层级语音模型,完成音色、语调和语速的高度还原。

支持 IP定制 满足全领域多场景应用

传统认知下,形象好、气质佳、普通化标准、音质好的人物才可以复刻出效果好的虚拟数智人,但基于认知AI及数智大脑原理制作数智人的拓元,早已打破这一前提。无论是政府机构、教育培训、MCN机构还是媒体单位,想要复刻的人物是男性、女性、老人还是儿童,拓元复刻技术均能根据不同外形、语音的人物设定复刻出专属他的IP元宇宙分身,并通过复刻而成的分身更换不同风格、不同场景,真正实现“1次复刻、N次分身”,为用户带来差异化营销体验。

此外,拓元还可提供专业的拍摄流程指导、复刻模型数据解析、个性化推荐等专属客户服务,并为客户隐私安全保驾护航。

低成本运营 助力企业降本增效

复刻好了数智人,怎么用呢?早在2019年人民日报社“果果”、新华社“新小微”就告诉了我们答案,虚拟人视频制作可通过SAAS服务、AI云计算及API开放完成。只是高额的制作成本、局限的应用场景,并不被普通受众所接受,大家仍持观望态度。但如今虚拟人已开始席卷国内各大短视频平台,很多刷到的口播短视频账号内容,都是由AI虚拟数智人生成,腾讯、字节跳动、微软等大厂已开放虚拟人制作平台,高成本虚拟人及虚拟人视频制作已是过去式。

拓元智慧也于近期开放了元分身产品平台,推出了颠覆式的AI黑科技。平台以打造高真实度AI数智分身为核心,通过文本编辑、个性化背景及字幕调整、多情感音色的选择,一键输出多场景多样化口播视频,突破了时空限制,实现了制片循环精简化、人效利用精益化、制作成本低廉化、制作产能规模化四大突破,为视频内容产业提供了元宇宙时代的崭新手段。可帮助自媒体创作者实现高质量文本输出、批量化视频内容生产,快速“养成”优质流量达人,同时还能助力医疗、娱乐、游戏、教育、通信、银行等企事业单位降本增效。

未来,拓元智慧将继续深耕AI虚拟数智人技术,逐步推动虚拟分身和元宇宙的普及化。

关于拓元智慧

拓元(广州)智慧科技有限公司(X-Era AI),简称“拓元智慧”,是一家具备原创领先技术的虚拟数智人技术及应用服务商。团队核心成员来自阿里、商汤、 Oxford、CMU、中山大学等知名企业,拥有多年的顶尖技术专家 AI工程化与业务落地经验。

拓元智慧拥有300多项技术成果,在国际顶级期刊/会议上累计发表学术论文300余篇,在数十项主流AI竞赛或者评测基准中获得冠军,十余次获得学术期刊及会议的最佳/优秀论文奖,获得中国图像图形学会科学技术一等奖、吴文俊人工智能自然科学奖、省部级自然科学奖等。

24快报
JSON抓取失败