随着ChatGPT连续爆火,生成式AI算法的突破,数字人身处元宇宙与ChatGPT这两大应用风口汇集点,被市场点燃了规模化应用的热情。虚拟人是应用计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等多种计算机技术,并具多重人类特征的综合产物。
数字人发展趋势
华通证券指出,年初以来,基于自然语言处理(NLP)技术聊天机器人ChatGPT掀起的应用热潮,ChatGPT有望在短期内将虚拟数字人的交互能力大幅提高。况且GPT-4的面世,GPT-4+数字人,构筑元宇宙中的“阿凡达”。数字人未来的用途将远不限于主播、客服等,随着算力的提升以及GPT-4的模型升级,数字人将成为个人分身“Avatar”,输出文字、图像、音视频,甚至细微到情绪表达。
得益于构建虚拟数字人所依赖的算法、CG、动捕、AI等技术逐渐成熟,在未来构建数字内容的过程中,虚拟数字人百花齐放。数字人集社交、创作、分享于一身,各种各样的形象风格、虚拟社会角色争先在全球亮相,承载多模态的杀手级应用,虚拟数字人已驶入了发展快车道。
政策环境暖风频吹,全球多个国家出台了多项虚拟数字人专项支持政策。仅国内市场,2021年将虚拟数字技术的发展纳入“十四五规划”,2022年上半年北京市经济和信息化局印发了《北京市促进数字人产业创新发展行动计划》,发展目标指出到2025年数字人产业规模突破 500亿元。再到《2023年全球虚拟数字人产业报告》出炉,虚拟数字人政策频频利好。
《2023年全球虚拟数字人产业报告》指出,近2年期间,全球虚拟数字人企业数量不断取得新突破,从12家激增至44家,同比增长2.7倍。火热的赛道也点燃了投融资市场热情。全球发生的投融资总事件从12起增加至44起,投融资总数量同比增长2.7倍。投融资总规模从1.65亿元扩大至49.88亿元,投融资总规模同比增长超29倍。
与此同时,据IDC预测,中国AI数字人市场规模预计到2026年达102.4亿元人民币。相较于同为虚拟内容的元宇宙市场规模,数字人的百亿级的规模预测似乎不算庞大。如今数字人与ChatGPT、AI技术的结合应用点很广泛,在不同领域的应用潜力十分巨大,当其更深入地融入传统实体行业的时候,也许带动更大的经济效益。
微软实现3D数字模型高质量生成
数字人爆发在即,科技巨头微软(MSFT.US)十分看好这个新型业态。近日,微软研究员们借助开源的三维渲染软件Blender和3D生成扩散模型RODIN模型,通过随机组合画师手动创建的虚拟3D人物图像,再加上从大量头发、衣服、表情和配饰中随机采样,进而创建了10万个合成个体,这样一张2D证件照,几秒钟就能设计出3D化身!
在文本到3D头像的生成上,研究员们采用了LAION-400M数据集的人像子集,训练从输入模态到3D扩散模型隐空间的映射,最终让RODIN模型只使用一张2D图像或一句文字描述,就能创建出逼真的3D头像。
据微软亚洲研究院作者们表示,目前RODIN的作品还主要停留在3D半身人像上,这也与它主要采用人脸数据训练有关,但3D图像生成需求不仅局限于人脸上。下一步,团队将会考虑尝试用RODIN模型创建更多3D场景,包括花草树木、建筑、汽车家居等,实现“一个模型生成3D万物”的终极目标。
微美全息拥抱浪潮,积极求变
无独有偶,据了解,作为虚拟人领域的翘楚,微美全息(WIMI.US)已拥有虚拟数字人相关技术储备。且该公司已在元宇宙数字人、VR/AR可穿戴设备、AI渲染等领域积极布局合作生态,后续将不断深入核心技术研发,逐步解索具体的业务模式,持续拓展业务的广度、深度,不断为社会更多的领域提供数字化、智能化的虚拟人解决方案。
目前在虚拟技术、大数据、人工智能等技术的加持下,虚拟数字人不断演化,形象越来越逼真。在此背景下,微美全息积极求变开发基于应用场景的虚拟数字人手势生成算法系统,通过环境的变化让虚拟数字人产生不同的动作。根据虚拟数字人的语言做出手势,同一句话在不同场景下的手势也会有所不同,因此,满足了对虚拟数字人的应用场景深层次的设计要求。
针对不同应用场景,微美全息使用不同语料库进行训练。对于同一个隐喻手势语义细分类别下的多个手势,采用自然语言处理技术,对手势文本与输入文本进行语义匹配,选择最匹配的手势。对于交流意图,通过自然语言理解,构建该文本到情感、手势隐喻语义的分类,与原始文本的关联关系,最终生成虚拟数字人手势。
更重要的是一点,微美全息基于应用场景的虚拟数字人手势自动生成算法,构建手势的量化描述语言,为手势的语义可计算提供了量化方法,构建富有情感的语料库,为虚拟人手势生成算法研究提供了数据基础。
结尾
总的来说,当前虚拟数字人的技术日趋成熟,数字人产业逐渐进入稳定增长的态势。特别在AI和ChatGPT技术热潮的助推下,虚拟人产业越发火热,加上全球各大科技巨头纷纷加速布局虚拟人赛道,这将进一步加速数字人产业规模的增长。可以预见新一轮科技浪潮的到来,有望大幅提高虚拟数字人的交互能力,给整个产业带来更大的想象空间,数字人的市场空间值得大家去关注。