数字孪生

虚拟数字人行业专题分析:AI赋能数字人变数智人

根据“量子位”发布的《虚拟数字人深度产业报告》,虚拟数字人指存在于非物理世界中,由计 算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重 人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物,也被称为虚拟形象、虚拟 人、数字人等。

(报告出品方:东方证券)

一、虚拟人的市场规模、产业链、发展趋势

1.1 虚拟人的定义及分类

根据“量子位”发布的《虚拟数字人深度产业报告》,虚拟数字人指存在于非物理世界中,由计 算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重 人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物,也被称为虚拟形象、虚拟 人、数字人等。 虚拟数字人的发展经过了多个发展阶段,其最早起源于影视行业,之后其应用逐渐拓展至游戏、 电商、金融、文旅等多个领域。近年来人工智能技术的突破使虚拟数字人的发展开始进入发展正 轨,但产业仍然处于初期阶段。

如果从驱动的方式来对虚拟数字人进行分类,可分为真人驱动型和智能驱动型。 — 真人驱动型虚拟数字人:主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音, 同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。 — 智能驱动型虚拟数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策 数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。该人 物模型是预先通过 AI 技术训练得到的,可通过文本驱动生成语音和对应动画。未来随着人工成本 的逐渐攀升、以及人工智能技术的持续进步,智能驱动型的虚拟数字人预计将成为行业趋势。

而从商业化和应用场景来区分,可以分为:内容/IP 型、功能服务型、虚拟分身型 3 类。内容/IP 型主要应用于影视、文娱、市场营销等场景,功能服务型主要应用于行业服务场景(电商、金融、 教育、医疗、文旅等行业),这两种类型虚拟数字人更多是面向 B 端;虚拟分身类型数字人除了 面向 B 端的应用,C 端用户也会有制作虚拟形象的需求,用于虚拟空间中的形象分身和代理(例 如在虚拟社交平台)。

1.2 数字虚拟人市场规模及产业链

2030 年我国虚拟数字人市场规模有望达到 2700 亿元。根据“量子位”的测算,在 2030 年我国 虚拟数字人整体市场规模将达到 2700 亿,细分市场包括:身份型虚拟数字人,主要来源于虚拟 IP 的巨大潜力,以及虚拟第二分身的发展;服务型虚拟数字人,多模态 AI 助手有进一步发展空 间,多种对话式服务也有望升级至虚拟数字人形态。

虚拟数字人产业的发展进程主要取决于: 1)虚拟数字人相关技术的进步。技术进步一方面可以改善虚拟人的呈现、交互效果,使虚拟人 拥有更加接近真人的外形和沟通交流能力,因此虚拟人替代真人服务的场景会进一步拓宽;另一 方面,可以降低虚拟人的制作和运营成本(和真人用工成本的差距扩大)和难度,使用门槛降低 会吸引更多的企业和用户。 2)基础设施的改善:例如 VR/AR 等显示设备的普及。 3)用户/企业的心智:用户和企业对产业的认知度和需求,但这也和虚拟数字人的技术进步程度 相关。

虚拟人的产业链一般分为基础层、平台层、应用层。其中: — 基础层:即为虚拟数字人提供基础硬件、软件支撑。基础硬件包括显示设备(即数字人呈现载 体,包括手机/电视/投影/LED 显示等 2D 设备,也包括裸眼立体/AR/VR 等 3D 设备)、光学器件 (用于视觉传感器、用户显示器的制作)、传感器(用于数字人原始数据、用户数据的采集)、 芯片(用于传感器数据预处理、数字人模型渲染、AI 计算)等。基础软件包括建模软件(对数字 人的人体、衣物进行三维建模)、渲染引擎(对灯光、毛发、衣物等进行渲染)。 — 平台层:集成上游的硬件和软件为虚拟数字人的制作和开发提供技术能力。参与者较多,包括 AI 厂商(微软小冰、商汤、科大讯飞等),各互联网大厂(腾讯、字节、百度、网易等在虚拟数 字人生态均有布局)、垂直 ISV 厂商(独立软件开发商,提供一站式虚拟数字人解决方案产品/服 务,将数字人能力封装成快速、轻量、标准化的 SaaS 产品)。 — 应用层:目前虚拟数字人的应用企业众多,遍布影视、传媒、游戏、电商、营销、金融、政务、 医疗等行业。

二、AI 赋能,进入“数智人”新阶段

AI 等技术快速突破,虚拟数字人的发展进入新阶段,由“数字人”变成“数智人”。近年来,AI 技术快速发展,尤其是 AIGC 技术(包括自然语言、图像、声音等多模态处理)近期的突破,虚 拟数字人也进入了发展新阶段。AI 技术覆盖虚拟数字人建模、视频生成、驱动等全流程。 一方面 AI 技术使数字人的制作成本降低、制作周期缩短、门槛降低,并获得和真人更加相似的外 形、动作效果,例如在 3D 数字人的建模环节,AI 建模相比人工建模所需时间大幅缩短、效率提 升,AI 建模目前已经初步实现产品化,可以开放程序接口对接各种应用,使用范围较广,也可以 实现 C 端应用(上传图片即可生成 3D 数字人面部模型)。 另一方面,多模态 AI 使得虚拟数字人的交互能力更上一个台阶,随着 AI 技术的不断完善,数字 人的感知能力(例如现在数字人对语言的理解主要以文本为主,未来有望实现多模态输入)、思 维能力、内容输出能力都将得到显著改善,在思想、语言、行为上和人更加接近、更加智能化。

2.1 各平台及相关厂商已经推出智能化数字人解决方案

目前,国内各 AI 厂商、互联网大厂、垂直 ISV 厂商均可提供较为成熟的具有 AIGC 能力的“数智 人”产品及解决方案。下文我们将以微软小冰、腾讯云、火山引擎(抖音集团)、百度智能云提 供的产品为例:

1)小冰公司(前身是微软小冰团队)

提供“AI 数字员工”产品:基于人工智能小冰框架,推出了数字专家和数字员工等完整产品线。 在形象定制方面,仅需 20 分钟的有效数据即可生数字人形象,支持多服装,多表情,多动作;内 容生成方面,基于小冰框架的人工智能创造能力(AIGC),数字人可实现对业务数据的快速学习, 获得相应技能,稳定输出文本、图片、音频、视频等内容;交互能力方面,拥有情感对话能力和 多模态交互能力,可人声定制,支持多语种、多方言。

2)腾讯云智能数智人

腾讯云智能数智人采用语音交互、虚拟形象模型生成等多项 AI 技术,实现唇形语音同步和表情动 作拟人等效果,广泛应用于虚拟形象播报(根据文本内容快速合成音视频文件,落地于媒体、教 育、会展服务等场景)和实时语音交互(实时语音交互支持即时在线对话,可赋能智能客服、语 音助理等场景)两大场景。平台提供虚拟真人 2D 形象、3D 写实数字人形象,基于腾讯云小微的 平台能力,为客户提供配套的生成界面,方便客户自主操作。目前在多行业落地,覆盖行业含金 融、传媒、交通、政务、文旅等。

3)火山引擎虚拟数字人

在 2023 春季火山引擎 FORCE 原动力大会上,火山引擎正式发布“善听”、“会说”、“能想” 的虚拟数字人创新产品。火山引擎依托 2D/3D 数字人技术,结合语音识别、语义理解、对话控制、 语音合成等多项全自研能力构建多模态交互体系,提供 3 大数字人产品方案:交互型数字人、播 报型数字人、直播型数字人。

4)百度智能云曦灵智能数字人平台

面向金融、媒体,运营商、MCN,互娱等行业,提供服务型数字人、演艺型数字人解决方案,降 低数字人应用门槛,实现人机可视化语音交互服务和内容生产服务,有效提升用户体验、降低人 力成本。百度智能云提供的数字人服务可应用在手机 APP 端、云屏端,可扮演智能客服、数字理 财经理、数字商品导购、数字培训师、数字讲解员等角色。

5)其他

世优科技:公司为虚拟人技术解决方案服务商,为政府、企业、品牌等提供虚拟技术解决方案, 覆盖应用场景包括广电媒体、品牌营销、电商直播/短视频、政府文旅、教育娱乐、影视番剧等。 23 年 4 月份推出新一代 AI 数字人产品——“世优 BOTA”,其基于世优自研的快速训练小模型 能力,与数字人形象结合,让 AI 从聊天窗口升级成人与“人”的直接交流,可成为企业的 AI 员 工。 天娱数科:子公司元镜科技的虚拟二次元网红 CiCi 已经在今年 2 月份开始的部分时段直播替换成 AIGC 互动直播,在测试应用期间粉丝居然未看出异样,同时粉丝量稳步提升。23 年 4 月份,基 于 MetaSurfing-元享智能云平台,天娱数科旗下的虚拟数字人“朏朏”已完成 ChatGPT 模型接 入,并完成直播首秀,目前常见的机器人客服和语音助手大多只能从顾客的问题中分析出预设的 关键词,并给出固定的回答,而朏朏不仅能够实时响应顾客的提问,还能根据不同问题进行自主 回答。

综合上述平台提供的解决方案,可总结出虚拟数字人后续的落地形态: 1)播报型数字人:数字人可以基于文字、基于关键词生成播报视频、音频,可大幅提升内容产 出效率(可应用于影视、营销、电商等领域); 2)交互型数字人:基于语音交互技术,可实现和人的实时互动;交互型数字人的应用场景较广, 既可以是 to B 的场景(例如作为虚拟主播、导购、客服、导览员等),也可以是 to C 的场景(例 如应用于虚拟社交社区); 3)智能语音助手:可以搭载于 IoT 设备,作为 AI 语音助手,成为人和 IoT 设备的联通桥梁。

2.2 标准化数字人解决方案成本大幅降低,覆盖群体变广

此前,数字人的制作、运营成本较高(项目预算几十万至上千万不等),因此主要的受众客户为 大型的企业、品牌或者政府机构。而随着技术的不断成熟和进步,数字人的生成和使用技术实现 标准化、模块化,除了面向大型客户的定制化项目及服务之外,面对小型商户的相对标准化的数 字人解决方案也逐步出现,使用价格大幅降低,甚至在某些领域已经低于真人员工成本(例如低 于真人电商主播的成本),预计目标用户群体会大幅增加。

以腾讯旗下产品“腾讯智影”为例,已提供低成本数字人播报 SaaS 工具(数字人直播解决方案 即将上线)。 “腾讯智影”是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、文章转视 频、模板创作、在线视频剪辑等功能,“智影数字人”是其中的核心功能,可提供数字人播报、 数字人直播(即将上线)解决方案。针对数字人相关解决方案,腾讯智影针对数字人播报的收费 模式主要有两种: — 付费会员(月份或年费):面向定制化需求不强的基础需求用户。用户只需开通付费会员就可 以使用数字人播报功能,并在付费会员的 2D/3D 数字人模板库中选择形象,不支持定制化。现阶 段(截至 23/04)的收费为高级会员 48 元/月、398 元/年,专业会员 88 元/月,698 元/年(高级 版和专业版每月可生成的数字人视频时长不同)。 — 定制服务:如果用户需要生成和特定真人类似的数字人或数字分身,可以采购其定制服务,用 户只需上传照片、视频、音频即可实现定制。目前收费是以年为单位,除了 32K 音色定制服务, 其他服务的首次定制的年费都在 1 万元以下(3000~8000 元/年不等),次年续费价格仅为首年价 格的 1/4。 另外,根据腾讯智影官方公众号,数字人直播解决方案预计于 4 月上线,提供的服务和功能包括: 7x24 小时无人直播节目制作、实时真人音频接管直播间、获取用户评论智能回复解答。其定价为 也是千元级别,包月使用,低于真人主播成本。

以万兴科技的“万兴播爆”APP 为例,平台通过 AIGC 技术助力海外电商营销,平台提供超逼真 的 60 多个国籍数字人模板,以及丰富的视频模板和素材,用户只需要输入文字,即可自动转化成 配音和短视频;同时也支持输入关键词,AI 生成多语言的营销脚本。可以大幅减少电商短视频制作的周期和成本。而“万兴播爆”目前的收费也较低,如果不需要定制数字人形象,而是使用其 模板库里的素材,那么用户只需要支付 168 元/月或者 1688 元/年的费用。

三、虚拟数字人在电商、营销、企业服务的应用逐步落地

虚拟数字人目前在多行业、多场景均有落地应用,较为常见的有游戏、电商、营销、文娱、企业 服务等。

1)虚拟数字人在电商行业的应用:覆盖面已开始逐渐扩大

虚拟数字人可以替代真人主播进行 7×24 小时直播,可解决主播不足、人力成本逐渐攀升的问题。 此前虚拟数字人的生成门槛较高、成本较贵,且后续的交付使用也存在一定难度,因此只有少数 头部商家会选择用数字人替代真人进行短视频拍摄、电商直播;但随着技术的不断完善,更多低 成本、标准化、智能化的解决方案和产品出现,预计受众用户群体会大幅增加。 目前以真人形象为基础的 2D 超写实数字人的制作、运营成本已经降到较低的水平,和人工成本 逐渐拉开差距。根据“新榜”报道,抖音平台上某本地生活类账号进行了两场带货直播,新榜旗 下的新抖数据统计,该账号2场直播的预估销售额在7万元左右,这2场直播全程由数字人完成, 单日成本仅 190 元,不需要场地、灯光、摄像头等硬件投入,只需要一台电脑。以“硅基智能” 平台提供的服务为例,数字人形象+声音克隆的费用为几万元/年,数字人如果用于拍摄短视频, 只需要支付大约几十元/分钟的时长费,如果用于直播带货,需要再支付几千元/月的服务费。而 前文提到的“腾讯智影”近期也将推出数字人直播解决方案,收费模式和水平也是“千元级别, 包月使用”。 随着 AIGC 技术的不断进步,数字人和用户在直播间的交互能力有望得到进一步提升,直播间的 转化效果有望和真人主播直播间进一步缩小差距。

另外,对于一些头部电商主播、明星电商主播等具有稀缺性的主播资源,其产能的瓶颈主要来自 于真人的直播时长有限,如果未来头部稀缺的电商主播、明星可以使用虚拟数字分身进行直播带 货的话,那么这些稀缺主播的产能瓶颈有望消除。近期,乐华娱乐旗下的明星“黄新淳”的虚拟 数字分身进行了一场直播(但不是电商直播),直播的硬件设备、配备人员要求也大幅降低(无 需场地布景、灯光、场控等);而未来,该类型的直播有可能会发生在电商类的直播场景中。

2)虚拟人在营销领域的应用

目前虚拟人在营销领域的应用可以分为两大类:一类是已经有 IP 价值及粉丝量的虚拟数字人为品 牌、产品进行品牌代言和推广。典型代表是燃麦科技推出的虚拟偶像 AYAYI(粉丝数:抖音 7.6 万、小红书 12.6 万、微博 87.9 万),她 2021 年以数字员工身份入驻阿里,并和美妆、珠宝、 3C、食品等多领域品牌合作进行新品推广;另一个案例是天娱数科推出的虚拟人“天妤”(粉丝 数:抖音 357 万、小红书 14.8 万、微博 51.9 万),她分别与珠宝品牌周大生、汽车品牌集度、 手游《倩女幽魂》达成合作。

另一类虚拟人在品牌营销领域的应用,是品牌的专属定制化虚拟人形象。目前不少品牌都有定制 专属的虚拟形象、虚拟 IP 的需求,例如花西子的虚拟形象“花西子”,浙文互联为东风风光打造 的虚拟人“可甜”等。

未来,随着虚拟数字人技术的逐渐成熟、成本逐渐降低,虚拟形象、虚拟 IP 有望成为企业营销方 案中的重要环节,而布局虚拟数字人相关业务的营销企业有望受益于虚拟人相关需求的增加。

3)在金融、政务、文旅等领域的垂直领域应用也逐步落地

另外,数字虚拟人在银行、政府机构、博物馆等文旅场所可扮演虚拟大堂经理、虚拟讲解员、虚 拟政务人员等数字员工角色。 以“世优科技”发布的 AI 数字人产品“世优 BOTA”为例。世优 BOTA 是基于世优自研的快速 训练小模型能力,与数字人形象结合,让 AI 从聊天窗口升级成人与“人”的直接交流,可担任企 业的 AI 数字员工。根据世优科技团队在产品发布会上的介绍,企业可根据业务场景定制专属的 BOTA 数字员工,可以导入企业自有数据库,基于企业私有数据快速生成小模型,实现更准确、 更有效率地回答问题,服务用户,可以 7*24 ⼩时在线,无需人工辅助;并且 BOTA 数字员工能 汇总不同使用场景下的问题和需求持续进化服务,越用效果越好。

4)泛娱乐行业:

以游戏行业为例,越来越真实的数字人游戏角色使游戏者有了更强的代入感,可玩性变得更强。

四、投资分析

虚拟数字人在电商场景的应用落地加速,预计使多条细分赛道受益。 由于虚拟数字人在电商领域的应用落地进程较快,可实现运营效率的提升以及成本优化,我们认 为产业链企业有望受益。具体包括:

1)虚拟数字人的解决方案提供方:随着虚拟数字人技术成熟及门槛降低,更多的商户将会产生 应用数字人进行电商运营的需求。而虚拟数字人解决方案提供商一方面可以提供定制化的服务 (针对头部客户、特定需求较多的垂类客户),同时也可以打包其能力提供标准化的产品和服务 (针对 C 端用户、通用需求较多的小 B 客户)。参与者主要包括各大互联网平台、AI 厂商、虚拟 技术服务提供商。

2)达人电商直播机构:这类机构的特点是在内容运营、人设打造、平台流量获取、商品供应链 把控方面有较深厚的经验和方法论积累,这些方法论可以从真人直播迁移到虚拟人直播;此外这 类机构通常和一些稀缺的头部电商达人、明星达人有密切的合作关系,而这些稀缺的达人资源在 数字分身技术的加持下,直播时长的瓶颈有望消除,稀缺达人产能有望提升。

3)在虚拟人业务方面有布局的电商数字营销企业、电商代运营企业:虚拟数字人有望逐渐成为 商家营销、电商经营的必备环节,虽然一些电商数字营销、代运营企业不一定有虚拟数字人的生 成技术能力,但是具备丰富的客户资源、营销内容和数据资源(尤其某些公司在行业垂类深耕多 年,具备该行业丰富的客户服务经验和相关数据沉淀),可作为商户采购虚拟数字人服务中的重 要桥梁。

4)跨境电商:例如在人工成本更高的地区,内容电商普及率有望提升,此外跨境电商还将在多 语言方面显著受益于 AI,降低海外多语言经营环境的传统障碍。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】。

24快报
元宇宙技术综述
昨天 22:10
JSON抓取失败