虽然元宇宙概念因大模型的火热而短暂熄火,但元宇宙内的“门面人物”虚拟数字人作为人工智能技术产物,得益于算力提升,迎来低成本、规模化落地的可能。
4月25日,腾讯云智能“数智人媒体沟通会”上,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性,可以轻松实现“自助式”数智人生产制作。
采访中,腾讯优图实验室研究总监汪铖杰对第一财经记者表示,以前行业做的数智人效果未必好,有的一看就知道特别假;现在的数智人看一眼,还要猜测它们到底是真还是假。
技术发展带动数智人产业落地
伴随人工智能技术的发展,国内偶像综艺、品牌代言人、热门网红等行业相继出现由数字人扮演的角色,同时数量不断增加。各家大厂也陆续发布了自己的数字人、虚拟人、数智人产品。
不论名字如何形容,其本质都是通过计算机图形学技术(Computer Graphic,CG)创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。据相关机构预测,到2030年,我国数字人整体市场规模将达到2700亿元。
腾讯则直接推出数智人的生产平台。腾讯方面介绍称,腾讯云智能小样本数智人生产平台依托腾讯自研AI能力和技术经验,需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。
另外,成本方面,该生产平台已将成本降低到千元级别,制作周期缩短至小时级,大幅降低数字人使用门槛。但是,3D超写实、高精定制等高技术要求的数智人仍要求高成本,以及具体针对客户需求进行定制。
腾讯云智能数智人产品总经理陈磊表示,小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。
相较于2D真人精品数字人,陈磊认为小样本数智人无需专业影棚录制素材,成本更低;相较于照片生成、仅能呈现面部形态的数字人,小样本数智人可根据文本设计手势,唇动、口型、表情复现真人风格。
东方证券研报分析认为,虚拟数字人的驱动可分为由真人扮演(业内称为“中之人”)驱动和 AI 驱动。过去 AI 驱动数字人的痛点在于成本较高、交互效果不佳,因此由真人扮演驱动更为常见,此类路线背后的商业模式内核是偶像娱乐工业、虚拟主播带货等,如字节跳动旗下游戏品牌朝夕光年和乐华娱乐共同打造的虚拟偶像女团A-SOUL。
另外,随着近期AI 领域的技术突破、文本、图像等领域的大模型应用的快速落地,AI 驱动的数字人的制作门槛和成本有望降低,例如外貌合成、动作合成等环节均可借助 AI 技术;数字人的对话能力有望得到质的提升,拥有更加接近真人的对话能力。可以推测,AI 与数字人的结合,将使数字人的应用场景及范围明显扩大,例如通过语音合成、表情合成以及深度学习等技术,打造的虚拟客服、服务助手等已在实际生活、工作场景中进入大规模应用。
行业尚未形成稳定竞争格局
4月下旬,浙江省人民政府印发《关于进一步扩大消费促进高质量发展若干举措的通知》,其中提出:抢抓电子商务直播快速发展机遇,发展数字人虚拟主播、元宇宙新消费场景等新业态新模式。发展“跨境电子商务+直播”模式,打造跨境保税仓直播总部基地,举办保税仓实景直播带货等活动。
东方证券研报分析称,短视频、直播电商是数字人应用的核心场景之一。数字人目前的主要应用场景包括营销代言、电商带货、客服等。其中,数字人进行电商直播带货的优势在于降低人工成本、不间断直播、可控性强。
人工成本是直播/短视频电商中的重要成本构成(且人力成本的增加是未来趋势),虚拟人可代替真人在电商直播或者视频拍摄中出镜从而降低人工成本的支出。另外,时长是直播电商产能的重要衡量指标,数字人可以和真人主播配合,例如真人主播在黄金时段直播,而虚拟人主播则在流量低谷时替代真人主播,实现 7×24 小时全天直播,可实现最大限度的客户触达。以及数字人形象和人设相对稳定,出错概率低,相对可控。
陈磊在采访中透露,目前已有好几个合作伙伴接入腾讯数智人,也上线了各大平台。另外,电商直播只是落地场景中一个小场景,作为个人数智分身,各行各业都有,只要是时间宝贵的行业都有这个需求。
天眼查数据显示,我国现有“虚拟人”“数字人”的相关企业66.2万余家。其中,超九成的虚拟人企业成立于5年之内,成立于1年内的相关企业占比41.9%。尤其是目前低技术门槛的数智人批量生产,极易造成同质化竞争局面。对此,汪铖杰对第一财经记者表示,在一些旧的生产模式往新的生产模式走的过程,大家都会找到自己的定位。
另外,陈磊对第一财经表示,腾讯的数智人产品从2018年开始找各个行业与场景寻找落地价值,解决客户实际问题痛点,所做的事情更多是产生实际价值这个点。通过小样本,从整体的发展阶段来看,让成本有足够的降低,让小样本数智人将企业历史沉淀算力,包括管线化能力在内的训练一站式,变成自助式工具化手段,赋能给行业的合作伙伴,帮助他们拓展场景,成就垂直场景的价值。
另外,客户企业选择也有自身的要求与标准。头豹研究院分析称,企业在选择虚拟数字人厂商时主要会考量几个因素:厂商的技术实力、报价预算、虚拟数字人后期运维服务,以及厂商和企业之间既定的互信合作关系,例如在银行业,人工智能服务涉及商业数据或客户隐私,企业倾向于交由熟悉的外包公司,而不是头部技术厂商来完成。
除此之外,头豹研究院分析表示,业内头部厂商在人像驱动、智能对话和语音交互等技术领域并无较大差距,差异化主要集中在两大方面:首先是知识图谱方面,虚拟偶像、虚拟带货主播、虚拟银行客服、虚拟财务员工和虚拟医生等不同场景下应用的知识图谱各不相同,同一场景下不同业务涉及的知识库也存在差异,以金融业为例,要求虚拟数字人厂商沉淀丰富的业务场景能力,针对金融企业的营销、风控、客服等场景均具备成熟的产品方案能力;其次是厂商和企业之间先行的互信合作关系,如客户向信赖的厂商提出需求,确定虚拟数字人的形象、功能、任务框架和知识图谱,由厂商进行后续的开发。
因此整体来看,国内虚拟人行业尚未形成稳定的竞争格局,市面也尚未出现成熟高端的应用产品,行业仍需持续投入底层技术研发,并在垂直行业争夺市场份额。