不是所有人都能挖到金矿,但每个人都需要一瓶水。
虚拟人赛道的性感不在皮囊,而是背后的技术迭代。
近日,又一位天花板级的优质偶像塌房,让人们将注意力再次转移到虚拟人市场。过去一个月,“虚拟美妆博主”柳夜熙仅凭借三条短视频,就在抖音上成功吸粉 800 万,已然成为国内虚拟偶像的天花板。再往前溯半年, 520 当天,超写实虚拟人AYAYI在小红上发表了第一篇笔记,阅读量接近 300 万。
不仅虚拟偶像,更泛化的虚拟人也频繁出现在大型晚会、热门综艺、颁奖典礼等活动中。
今年央视春晚现场,刘德华以虚拟形象炫酷登场,和王一博、关晓彤本不在一个时空,却能在同一个舞台实时演出。这个节目背后,是借助世优科技的实时虚拟合成技术。
虚拟人赛道上,世优科技把自己定义为虚拟技术的提供商,具备不同级别动捕设备的生产能力,还自主研发虚拟工厂系统实时快速地制作虚拟内容,打造虚拟形象。动捕技术只是底层技术,最大的特点在于实时,能够让虚拟人完美匹配交互、直播等场景。
在商业变现方面,公司以to B业务为核心,在广电节目、品牌营销、直播、短视频、教育均有成熟商业化落地。随着元宇宙概念的爆火,世优科技则制作了多个头部明星虚拟形象,为明星品牌营销提供了元宇宙分身的基础。
接下来,世优科技还将开发一款娱乐内容社交产品Meta Avatar Show,并将其定义为元宇宙中的抖音,以此试水C端市场。
世优科技CEO纪智辉认为,现在的虚拟人产业正在经历淘金热,单一技术、硬件厂商是产业链的上游,市面上大量的虚拟人运营公司则处于产业链下游。此外,传统动画 1 分钟 12 万,需要大量的人力和成本,但是利用世优科技的快速动画技术,只需要将虚拟IP运营的成本,降低到十分之一,极大提高生产效率。在虚拟人产业中,不是所有人都能付出高昂的成本在行业里面淘金,但是人人都需要轻量化的虚拟技术解决方案,比如在这个行业里面每个人都需要一瓶水,解决生存的刚需。世优科技扮演的角色,则是虚拟人行业中的“卖水人”。
核心技术启蒙阶段
虚拟人的概念很宽泛,柳夜熙、初音未来、AYAYI、A-SOUL是我们当下谈论最多的虚拟人,但其背后的底层技术大多不同。在对虚拟人的争论中,QQ秀、游戏里面的3D动画角色也逐渐划分到虚拟人的范畴。
这让很多人不理解,虚拟人的定义到底是什么?
如果从技术层面也就是制造方式来看,虚拟人分为两种。一种主要基于CG动画技术,就是大家常说的特效制作,通过2D绘画,比如简单抬一下眉毛,就需要画 24 帧,制作一步动画片成本极高;另一种是通过3D建模所制造出的动画人物,面部模拟和动作捕捉进行的真人实时模拟,可以通过专业设备或摄像头捕捉,同时真人演员提供配音。
世优科技正式成立于 2015 年,主要研发动作捕捉的实时动画技术,在公司成立以前,一直以技术实验室的方式存在。
2004 年,纪智辉和一位MIT的博士共同组建这个实验室,主要研究方向包括数据挖掘、图形图像算法、工作流引擎、实时动捕技术等前沿技术,是国内最早的一批研发实时虚拟人的技术团队。
“当时的技术完全处于裸奔状态,只有极少数本身钻研这项技术的人或者是商业敏感的团队才会投入到这个领域。”纪智辉告诉小鹿角财经,技术投资是高风险高收益,但处于早期阶段的技术,距离落地比较远,没有任何商业变现场景。
咨询公司Gartner曾经提出过新兴技术成熟度的曲线,任何新技术从诞生到落地,都需要经历萌芽期、期望膨胀期、泡沫破裂低谷期、稳步恢复期及生产成熟期五大阶段。
所以,从市场进化程度来看, 2011 年虚拟人关键技术算法都还处于萌芽期。
世优科技创始人纪智辉因为对虚拟技术未来的看好,整合多个名校毕业的博士生,进行虚拟技术与算法的研发。
“当时的实验室完全是烧钱养技术,靠给门户网站做SP业务、版权业务等带来的流水支撑下去。
”纪智辉提到, 2009 年之后,移动互联网开始崛起,前面两项业务也急转直下,这时就必须考虑技术变现的问题。
2010 年,电影《阿凡达》在国内上映,动捕技术开始被市场认知。
公开资料显示,《阿凡达》制作与宣传总成本超过 5 亿美元,是当时最贵的一部电影,其中制作费的一半以上都花在了3D技术的应用上,前后有 48 家特效公司投入到电影制作中。
具体来看,《阿凡达》采用虚拟摄影机的模式,所有的3D图像都是在动作捕捉的基础上,依靠计算机自动生成的。在虚拟摄影机中,可以看到戴着动捕设备的真人演员和CG场景,片场的监视器可以实时看到演员和场景结合的画面。
“以前的虚拟人都是动画制作,要靠动画师一帧一帧地抠出来,费时费力成本极高。《阿凡达》的上映推动了虚拟人生产制造在工艺和流程上的革命。”纪智辉表示。
《阿凡达》应用的最核心技术就是实时动作捕捉,这也是日后推动虚拟人蓬勃发展的关键技术。
2011 年,纪智辉开始尝试基于动作捕捉和实时软件来实时驱动虚拟形象。《阿凡达》也让他意识到,有虚拟形象的影视可以是技术变现的出口之一,并将业务聚焦在为影视产业提供虚拟场景和虚拟形象。
“实验室积累下来的技术和设备都得到行业的认可,用动捕设备来制作虚拟形象的概念在国内市场也很前卫,当时不少影视公司都找到我们。”纪智辉说。
《阿凡达》之后,越来越多的国产电影开始注重特效,市场需求逐渐放量,世优科技也轻松拿下了 3500 万元的天使轮融资,由GGV纪源资本领投。
商业变现的初体验
在合作了众多影视公司之后,纪智辉发现,制作虚拟人的技术愈发成熟,但是每项技术都不互通,这导致传输到终端的数据,还需要人工分门别类地进行后期处理。
比如最核心的动捕技术,面部、躯干和四肢都采用不同的设备,有些利用惯性动捕设备,有些利用光学动捕设备。
在很多大型直播活动上,当一名虚拟偶像出现时,其面部、身体要由两个人分别携带动捕设备。此外,还需要技术人员将两块动捕动画进行合成,再与“中之人”的语音录制进行音视频合成,最终才能呈现出观众看到的直播间效果。
去年 4 月,虚拟人洛天依与李佳琦同框直播的噱头引发一波关注。直播过程中,一度出现李佳琦能听到洛天依的声音,观众却听不见的翻车事故。
所以,除了自主研发动捕设备外,世优科技还研发了一个数字人Hub和引擎,可以对接目前市场上主流的动捕设备商,这也是世优科技在技术领域的竞争壁垒。
这套技术最大的优势在于开放性和系统性,世优科技可以根据客户不同应用场景需求接入不同动捕厂商、不同精度级别价格的设备,把单一、局部的动捕设备升级成全身完整的动画制作系统。
“制作一个虚拟人,你可以理解为打造一台汽车,现在市场上的技术公司都只是提供发动机等零配件,但是客户需要的是一台整车,我们做的就是通过自主研发系统,把零配件组装起来,给客户提供一辆完整的汽车。”纪智辉解释。
在这个产业里,世优科技一直将技术领先性作为公司的核心竞争力,并在动作捕捉、表情捕捉、手势捕捉在内的多模态动作驱动的底层技术等方面,拥有 40 多项计算机软著, 20 多项国家发明专利,并斩获了中关村高新技术企业及国家高新技术企业,中房杯5G商旅文科技创新应用奖、 2020 中国校园好方案创新力品牌奖、北京市用户满意评价证书、年度VR/AR行业应用奖、年度优秀VR/AR内容创作团队奖、年度优秀VR/AR硬件奖等多个奖项。
有了技术,还需要找到商业变现的场景。
除了影视,世优科技最先接触的是电视节目市场。
影视公司对虚拟形象的精度要求非常高,整个的制作周期很长,资金的流动性较差。但电视节目恰恰相反,节目本身有虚拟主持人的项目,品牌也有植入虚拟形象的需求,同时电视台也有较强的购买力。
凭借多年的技术积累,世优科技开始和央视、东方卫视、湖南卫视等多个电视台展开深入合作。
2016 年和 2020 年的央视春晚,世优科技都是实时角色动画技术的提供商之一,同时还帮助央视体育频道,将贝克汉姆的虚拟形象搬到直播间;东方卫视《 80 后脱口秀》上,世优科技制作的“趣多多”这一虚拟IP和王自健亲切互动;喜剧真人秀栏目《食在囧途》徐峥和“苏宁小狮子”虚拟角色同台演出。
2012 年东方卫视《 80 后脱口秀》世优提供虚拟技术
2016 年CCTV5《豪门盛宴》世优提供虚拟技术
2016 年浙江卫视《食在囧途》世优提供虚拟技术
在当时,为电视台制作实时虚拟形象已经成为世优科技的主要业务线条,公司也逐渐生成一套面向广电的解决方案“虚拟工厂”。这套方案意在为电视台输出一套性价比较高的虚拟形象生产方案,包括硬件、软件和具体服务。
2017 年,世优科技完成了捷成世纪 2500 万人民币的A轮融资,捷成世纪主要业务为向广电输出全价值链的音视频产品与服务,是这个领域头部企业。
2018 年,为了增强公司虚拟形象收入的多元化,公司开始切入更多的场景,涵盖直播短视频、线上教育、品牌营销、国漫番剧等。截止到目前,帮助合作方复活了近 500 个虚拟形象。服务客户包括广电行业的头部客户:每年央视春晚的虚拟技术支撑、央视多个频道的虚拟系统设备提供及节目制作支持,及东方卫视、湖南卫视、山东卫视、浙江卫视等。在互联网行业:华为、小米、腾讯、百度、网易、京东、阿里、苏宁等也均使用过世优科技的虚拟技术及服务。
C端市场的探索
虚拟人在今年终于迎来了爆发期,也到了从小众走向大众的时机。
这也是整个产业的共识,公司前期做TO B 的业务,通过B来触达C,起到教育市场的目的,在技术和市场都更加成熟的阶段,直接触达C。
纪智辉认为,虚拟人作为元宇宙的基础设施,只有通过C端市场才能真正与元宇宙结合。
世优科技目前仍以B端市场为主要业务,是公司的主要利润来源,同时利用目前已有的技术方案,在C端市场试水。
据专业人士分析,对于元宇宙概念本身而言,市场更需要一个能具体落地的产业、经济价值与之结合,而游戏、虚拟人及其他虚拟产品等“似乎距离更近”。
按照应用场景划分,B端的虚拟数字人大多为服务型,是社会角色的替代,比如主持人、主播、偶像等,C端的虚拟人则是身份型,是真实用户的辅助分身,也是元宇宙的入口。
据透露,世优科技正在准备推出一个“Meta Avatar Show”元宇宙分身秀平台,应用内除了可以为每个用户、企业、明星、名人、IP等定制打造元宇宙分身外,还为这些分身提供大规模、低成本的软硬件系统,能够连接并驱动分身。
由于动捕设备的价格门槛和应用场景的局限,普通终端用户没有动力购买高端动捕设备或定制虚拟人形象。此外,根据瑞银报告的说法,高级虚拟人物的先期投入成本平均为 3000 万元,比如A-SOUL就属于这一类,且后期运营也是一笔不小的开支,单曲的制作成本大约为 200 万元,一场线下演唱会成本约在 2000 万元。
“对于品牌方来说,通过动作捕捉技术制作实时驱动的虚拟人,和传统的CG等技术比起来,精度相同的情况下,世优科技能够把成本降低90%,对于普通用户来讲,做直播或者是游戏等,精度远低于企业营销的需求,软硬件系统的成本自然就降下来了。”纪智辉说。
Meta Avatar Show主要聚焦在娱乐内容社交方向,除了虚拟形象外还在打造诸多虚拟场景,里面填充的内容则是通过UGC和PGC两条路线,前者让每个人都可以拥有自己的Show空间,像朋友圈一样,发图文、视频等来充实平台内容,后者则是通过世优科技开发的MetaStage,邀请PGC团队产出音乐会、影院、画展等更丰富的内容。
据悉,知名老牌私募机构多闻投资基金管理(北京)有限公司(以下简称多闻资本),为世优科技Meta Avatar Show特设立“元宇宙”板块专项基金,用于Meta Avatar Show资源对接、技术研发、与推广。此基金投资人均为行业内有明星资源、虚拟技术行业经验的人群,为Meta Avatar Show提供了强有力的资源加持。
多闻资本主要从事非证券业务的投资管理、咨询;股权投资管理等业务。公司主要投资方向为AI人工智能、医疗大健康、新能源汽车、农业大数据、环保科技等领域。投资企业均为研发型、技术驱动的公司,研发和技术实力强、行业门槛高。 投资项目为客户创造超额价值,均处于国家大力支持发展且市场空间巨大的行业。
此外,Meta Avatar Show除了可以给现有短视频平台输出常规音视频内容外,还提供VR/AR全景沉浸式体验。
12 月 8 日,天风国际分析师郭明錤发布研报表示,苹果已经刚开始规划第二代AR/MR头戴装备,预计 2024 年下半年出货。在下游生态未完全建立之时,VR/AR的硬件设备的渗透率直接决定行业未来走势。
“现在就像是 10 年前智能手机普及的那段时间,有了只有硬件的普及率提升了,软件才能有市场。”纪智辉告诉小鹿角财经,Meta Avatar Show就像是元宇宙里面的抖音,是元宇宙时代娱乐内容社交的新模式。
市场对元宇宙还没有明确且统一的定义,但目前已经问世的产品,在技术、类型、交互方式等方面大多相似。
比如,英伟达推出Omniverse Avatar,将建模与AI技术结合,帮助元宇宙创作者建立虚拟人物形象,可理解自然语义,甚至能实时转换语言。上个月,天下秀基于区块链技术开发的3D虚拟社交产品——虹宇宙(Honnverse)也火爆网络,天下秀董事长还在微博中提及,该产品未来还将引入VR、AR、MR以及量子计算等新兴技术。
诚然,有些公司是元宇宙的虔诚信徒,在技术研发、商业变现等方面积累深厚,但不乏大多数公司都是想借着元宇宙的概念炒一波热度,提振一下二级市场的股票。
无论是虚拟人还是元宇宙,在技术上,这些产业已经到了期望膨胀期。资本和媒体的期待值过高,但消费市场似乎泼了一盆冷水,硬件的出货量或是虚拟人落地场景,都很难和这一期待画上等号。
当被元宇宙这一风口裹挟的公司也越来越多,如何调整不对等的心态,如 何保证技术的成熟稳定性,如何稳住公司规划的节奏,或许是当下淘金热的人最应该思考的问题。