数字人

萌萌的虚拟数字人:元宇宙入口的一个争夺焦点

宇宙之中国优势: 虚拟数字人, 分发与流通环节的新战场 。元宇宙发展方向上, 中国有望在内容与场景、协同方领域潜力巨大

元宇宙之中国优势: 虚拟数字人, 分发与流通环节的新战场 。

元宇宙发展方向上, 中国有望在内容与场景、协同方领域潜力巨大。

全球视角下的元宇宙布局以美国与中国为主占据主导, 其次是日本与 韩国积极跟进。 海内外公司资源禀赋不同, 因此发力方向与受益逻辑 有所差异, 中美日韩的元宇宙发展与布局各有千秋:

1 ) 美国在硬件 入口、 后端基建、 底层架构三个方向优势最大;

2 ) 中国在内容与场 景、 协同方领域具备优势, 在人工智能与后端基建存在弯道超车的机 会;

3 ) 韩国政府强力引领, 偶像工业驱动;

4 ) 日 本 ACG 产业积累 深厚, I P 资源丰富。在移动互联网时代, 中国在变现流通环节表现出 强大的主观能动性, 如极致内容变现形态的直播带货的快速发展。 基 于在变现环节强大的主观能动性, 我们认为国内的数字藏品 ( NFT ) 与虚拟数字人预计是优先受益的方向。

虚拟数字人的生成有两条技术路径: CG 建模、 AI 驱动。

1 ) 在视觉 表现层面, 用 3D 建模 /CG 技术做出从外形、 表情到动作都 1 : 1 还原 真实的人, 让虚拟数字人更像人, 但通过 CG 等传统技术手段生成的 虚拟数字人所耗费的成本高昂;

2 ) 生成虚拟数字人的第二条技术路 径为人工智能, 具体又细分为两种,

一是在最初以 3D 建模 /CG 技术 将虚拟人尽可能逼真地绘画出来, 后续虚拟数字人的语音表达、 面部 表情、 动作由 AI 深度学习模型的算法进行驱动;

二是建模与驱动均基 于 AI 算法。 在虚拟数字人的创作中, AI 的价值在于大幅降低了制作 成本、 简化了制作流程。

同时, 一些用于生成虚拟数字人的工具化平 台已经出现, 让创作者与普通用户都能快速生成自己的虚拟形象,如 英伟达的 Omniverse Avatar 、 Epic 的 MetaHuman Creator 等。

虚拟数字人的商业价值何在?

虚拟数字人行业步入快速发展期, 相 应的商业模式也在持续演进与多元化。

国内外虚拟数字人的入局方在 技术水平、 关键场景、 产品形态与运营方式上有一定差异, 参照日韩 虚拟数字人的发展, 结合目前国内发展现状, 我们认为虚拟数字人将 率先在文娱、 广告、 虚拟代言人等领域实现商业落地。

1 ) 文娱产业 的虚拟直播、 虚拟偶像等应用。 早期虚拟偶像破圈较为成功的当属日 本的初音未来与国内的洛天依, 相较于日本偏向于打造二次元虚拟形 象, 韩国培养的超写实虚拟形象助力虚拟数字人从二次元向三次元破 圈;

2 ) 服务于广告变现。 随着数字化、 智能化的发展, 虚拟数字人 已经成为电商营销升级的新载体, 已有诸多应用案例, 如美国的 Lil Miquela 、 韩国的 Rozy 、 中国的 AYAYI ;

3 ) 预计消费品牌将会培育自己的虚拟数字人形象代言。

1. 元宇宙发展方向上,中国有望在内容与场景、协同方领域潜力巨大

1.1. 海内外元宇宙发展与布局各有千秋元宇宙的构建是一个庞大而复杂的系统化工程,

我们尝试按照价值传导机制,以体验的升级为终点,倒推实现这种体验所必备的要素,进而分拆出元宇宙研究框架的六大组件。

首先是提供元宇宙体验的硬件入口(VR/AR/MR/脑机接口)及操作系统,其次是支持元宇宙平稳运行的后端基建(5G/算力与算法/云计算/边缘计算)与底层架构(引擎/开发工具/数字孪生/区块链)。

再次是元宇宙中的关键生产要素(人工智能),最终呈现为百花齐放的内容与场景,以及元宇宙生态繁荣过程中涌现的大量提供技术与服务的协同方。

元宇宙代表着下一代互联网机遇,若国家与公司错过这一发展机遇,极有可能就会落后。元宇宙为在 PC 互联网与移动互联网时代迷失的国家带来弯道超车的机会。

因此,在元宇宙的大背景下,每个国家都依托自身资源禀赋进行全面布局以进一步强化竞争优势。

全球视角下的元宇宙布局以美国与中国为主占据主导,其次是日本与韩国积极跟进。海内外公司资源禀赋不同,因此发力方向与受益逻辑有所差异,中美日韩的元宇宙发展与布局各有千秋。

美国:在硬件入口、后端基建、底层架构三个方向优势最大。

美国对元宇宙的关注点集中于基础设施与功能性平台,其核心竞争力主要体现在硬件入口及操作系统、后端基建、底层架构等方面,同时在人工智能方向也具有较强的竞争力;

从应用层面来看,美国不仅局限于游戏、娱乐等面向 C 端消费者的场景,在工业设计等面向 B 端的场景上也有所延伸,从而驱动工业生产应用的效率提升。

中国:在内容与场景、协同方领域具备优势,在人工智能与后端基建存在弯道超车的机会。

中国最大的潜力在于用户基数与社交基因优势,在后端基建与人工智能领域预计有后发优势。我国目前在底层技术上仍处于跟随与追赶的态势,但是得益于强大的基建能力及人口规模优势,后续有望在 5G 等后端基建、人工智能、内容与场景方面爆发出巨大的增长潜力。

韩国:政府强力引领,偶像工业驱动。

韩国元宇宙由政府引领,以三星为代表的韩国公司在“虚拟数字人”领域技术领先,应用场景则主要由韩国成熟的偶像工业驱动——虚拟偶像是最先试水的方向。

日本:ACG 产业积累深厚,IP 资源丰富。

背靠丰富的 ACG 产业基础与 IP 储备,日本元宇宙的应用场景已逐步在由游戏向演出会议等场景延展。

1.2. 国内的数字藏品与虚拟数字人预计是优先受益方向。

移动互联网发展至今,流量红利已见顶,元宇宙的发展将开启互联网产业的新周期,一方面推动 5G、人工智能、区块链等基础技术的升级,另一方面又关联着游戏、社交、内容乃至消费领域商业模式的变革。

我们所建立的元宇宙六大投资组件,必将同步运行于不同的发展阶段,但在不同的发展阶段,呈现出来的投资价值,从配置的角度所赋予的权重不同。

终极的元宇宙所呈现的内容与场景必然百花齐放,抢夺用户时长/注意力的效果越显著,投资的重要权重将增加。但在当下混沌期,元宇宙将有新内容或场景应用出现,引发全市场的关注与跟进,以吸引越来越多的厂商快速入局、匹配资源去大力布局。

在初始阶段,核心关注新内容的崛起。在通往元宇宙终极形态之前,行业内的内容供给方将在不同节点或方向上实现创新,这过程中,预计会出现一种或者多种新的内容或应用。站在当下,即元宇宙的起点上,预计新内容会从游戏、社交、视效内容以及 to B 应用出发,去抢夺用户时长。

游戏内容:

爆款内容大概率发轫于游戏,元宇宙的虚拟性天然适合游戏,同时游戏也有元宇宙需要的最成熟的用户、盈利模式,当下 Roblox 已经迈出了重要一步——世界最大的多人在线创作游戏,它兼容了虚拟世界、休闲游戏、自建内容,游戏中的大多数作品都是用户自行建立的;从 FPS、RPG 到竞速、解谜,全由玩家操控那些圆柱、方块形状组成的小人们参与、完成,吸引玩家的月活数据超 1 亿;同时在 Roblox 中,玩家拥有“币权”。

社交:

元宇宙能最大限度地打破物理空间的界限——这一特性,先天决定了元宇宙能提供高度互动、共享、高参与感的社交体验,相较线下更多的社交玩法促使诸多社交活动向线上迁移。仍以 Roblox 为例,其意义远远超出游戏领域,正在成为朋友聚会的另一个场所,即另一种形式的社交媒体,未来甚至会对社交平台产生明显的竞争效应。

视效内容:

2020 年 4 月,美国著名流行歌手特拉维斯〃斯科特(Travis Scott)在游戏《堡垒之夜》中举办了一场虚拟演唱会,容纳了全球千万观众参加;

2021 年,国内的江苏卫视与芒果 TV 也分别推出了《2060》、《潮音实验室》虚拟演唱会相关的节目。

基于虚拟人、引擎、VR/AR 等技术的发展,线下场景数字化趋势显著,沉浸式体验已成雏形,一些新的内容形态也在探索中。

to B 应用:

to C 端的泛娱乐之外,元宇宙还将包含更广泛的 to B 端的应用场景。由数字孪生、虚拟现实与混合现实构建的“企业/工业元宇宙”解决方案技术,将成为智能制造行业必备的一种新型基础设施,给企业生产在诸多方面带来便利。

2021 年 9 月微软CEO Satya Nadella 在演讲中提出了“企业元宇宙”这一新概念;英伟达产品路线升级为 GPU+CPU+DPU“三芯”,旗下 Omniverse 定位“工程师的元宇宙”。

相较于美国,中国在社交、to C 端内容与应用方面优势显著,美团、拼多多、抖音视频直播、京东物流、滴滴打车、共享单车、移动支付等,这些都是特有的中国式创新。

类比移动互联网的发展历程,我国得益于巨大的人口红利优势所带来的网民规模优势,使中国在移动应用层面逐步显现出领先的态势。未来伴随互联网用户的迁徙惯性,我国也将成为元宇宙的最大市场,有望在 to C 领域的场景应用方面爆发出巨大的潜力。

在移动互联网时代,中国在变现流通环节表现出强大的主观能动性,如极致内容变现形态的直播带货的快速发展。基于在变现环节强大的主观能动性,我们认为国内的数字藏品(NFT)与虚拟数字人预计是优先受益的方向:

数字藏品将带动优质 IP 的价值重估。

数字藏品及其背后区块链技术的意义在于为数字版权提供了的确权与交易两套基本机制(对应中国内容优势)。

数字藏品可以锚定虚拟资产的价值,有助于推动内容资产价值的重估,有三重逻辑:解决版权保护痛点、重塑资产流通性、加速数字资产化。我们认为需重点关注拥有优质 IP 的传媒内容公司,数字藏品将为 IP 带来新的流通空间,也开辟了新的创作空间。

虚拟数字人的时代已开启。

借鉴亚文化相近的日韩虚拟人发展,预计中国虚拟数字人行业将迎来快速发展(对应中国式创新,中国企业善于做变现,如直播电商)。

我们的元宇宙研究框架中强调了人工智能作为核心生产要素的重要作用,预计未来元宇宙中的AIGC(相对于 PGC、UGC 而言)将会越来越丰富,而基于 AI 驱动的虚拟数字人则属于这一范畴。

虚拟数字人并不是新鲜概念,除了早期 B 站的卡通形象洛天依,目前已有众多公司或机构入局,且技术的仿真效果更加成熟,虚拟人越加越接近真人形态,如阿里的“AYAYI”、抖音 UP 主“柳夜熙”等。

2. 虚拟数字人:分发与流通环节的新战场

2.1. 虚拟数字人是人工智能体的初级形态。

虚拟数字人这一概念不是这两年才有,也不是随着元宇宙的概念出现而出现,而是可以追溯到 20 世纪 80 年代,人们开始尝试将虚拟人物引入到现实商业世界中,此时的虚拟数字人的制作手段以手工绘制为主。

1982 年,日本动画《超时空要塞》播出后,制作方将女主角林明美包装成演唱动画插曲的歌手,并制作了音乐专辑,林明美成为世界上第一位虚拟歌姬。1984 年,英国人 George Stone 创作出一个名为 Max Headroom 的虚拟人物。

21 世纪初,CG、动作捕捉等计算机技术进步,取代传统手绘进行虚拟数字人的创作。该阶段的虚拟数字人开始达到实用水平,但成本非常高,主要应用于影视娱乐行业,如数字替身、虚拟偶像等。2007 年,日本制作了第一个被广泛认可的虚拟数字人“初音未来”,初音未来是二次元虚拟偶像的代表。

近五年,得益于人工智能技术的发展,虚拟数字人的制作流程得到有效简化,且成本进一步降低,虚拟数字人行业开始快速发展,众多虚拟数字人在各行各业出现,如美国的 Lil Miquela、日本的 imma、欧洲的 noonoouri、韩国的 NEON 等。

元宇宙发展趋势下,虚拟数字人将是不可或缺的因素。虚拟数字人并非依托元宇宙而产生,但 2021 年元宇宙的火爆一定程度上带动了虚拟人热潮。在元宇宙六大投资版图中,我们特别强调了人工智能的作用,在于其将在元宇宙的建设中发挥重要的生产要素作用。未来的元宇宙世界中,将会是人类化身与人工智能体共存,我们认为现阶段的虚拟数字人是人工智能体的初级形态

2.2. 两条技术路径:CG 建模、AI 驱动

虚拟数字人背后的具体技术难点或者技术差异如何,我们下面的分析主要聚焦于三个问题:

1)如何做到 1:1 还原的数字虚拟人;

2)在突破了静态下高仿真的瓶颈后,如何让虚拟数字人实现自然地交互;

3)未来在元宇宙场景中,如何规模化生成用户的虚拟形象。

虚拟数字人的生成涉及计算机图形学、图形渲染、动作捕捉、深度学习与语音合成等诸多技术。简化来看,针对以上三个问题,我们分析发现,目前数字虚拟人主流制作技术分为两条路径,一是 3D 建模/CG 技术,二是 AI 驱动,同时一些用于生成虚拟数字人的工具化平台已经出现。

在视觉表现层面,用 3D 建模/CG 技术做出从外形、表情到动作都 1:1 还原真实的人,让虚拟数字人更像人;

以人工智能技术去生成虚拟数字人,并赋予其一定程度的自主感知能力、逻辑推理甚至情感表达能力;

更轻量、便捷的工具让创作者与普通用户都能快速生成自己的虚拟形象。

2.2.1. 从很像到很真:影视&游戏级的 CG

技术CG(Computer Graphics)是通过计算机软件所绘制的一切图形的总称,随着以计算机为主要工具进行视觉设计与生产的一系列相关产业的形成,国际上习惯将利用计算机技术进行视觉设计与生产的领域通称为 CG。

CG 技术的出现与发展扩大了影视内容的维度,促进了一系列 3D 动画片与超现实影片的出现,内容创作中的虚拟场景、虚拟人物有了实际技术支撑。

因此广义上来看,虚拟数字人并不是近几年才有,早期 3D 动画、科幻电影、游戏中的虚拟人物可被认为是初级形态,主要靠动画师或建模师将人物一笔笔、一帧帧画出来,在完成原画建模与关键点绑定后,还将运用到实时渲染、真人动作捕捉等相关技术。

韩国内容创意公司 Sidus Studio X 于 2020 年 8 月推出了虚拟数字人 Rozy,Rozy 便是以 CG 技术创作出来的,以真人为对象拍摄后,通过 CG 将平面上绘制的 Rozy 脸部进行 3D 建模。

但通过 CG 等传统技术手段生成的虚拟数字人所耗费的成本高昂。以游戏为例,为考虑到用户的显卡运算能力,传统流程制作出的游戏角色仍与真人在细节上有一定差距;

再比如影视领域,环球影业运用 CG 技术还原已去世的保罗在《速度与激情 7》中的演绎,相关渲染成本增加了约 5000 万美元。目前,Rozy 在广告拍摄制作中,制作团队仅对其脸部进行建模,其他则用 AI 进行驱动,原因在于全部使用 CG 制作的成本过高。

2.2.2. 从形似到有神:AI 驱动带来成本降低

生成虚拟数字人的第二条技术路径为人工智能,具体又细分为两种:

1)在最初以 3D 建模/CG技术将虚拟人尽可能逼真地绘画出来,后续虚拟数字人的语音表达、面部表情、动作由 AI深度学习模型的算法进行驱动;

2)建模与驱动均基于 AI 算法。

总结来看,虚拟数字人有三种存在的形式:

1)建模与驱动均靠人力运用传统的 3D 建模/CG技术,花费的时间与成本巨大;

2)最初的形象建模靠人工,后续驱动靠 AI;

3)形象建模与后续驱动均靠 AI。

在虚拟数字人的创作中,AI 的价值在于大幅降低了制作成本、简化了制作流程。

即使突破了静态下高仿真的瓶颈,如何让数字虚拟人自然地交互,也是一大难题。

人类可以从表情、肢体中读取丰富的非语言信息,因此数字虚拟人的表情、动作中一些细微的不自然都能被人们所察觉到。

比如一个简单皱眉,将牵动骨骼、肌肉、皮肤的一系列变化,若用传统的手工方

式去调整,工作量极其巨大。此时,AI 的价值就体现了,可以大幅降低工作量与制作成本。

24快报
JSON抓取失败