数字人

虚拟人过热,但虚拟赛道将迎来新拐点

2022 年 2 月,被公认为全球第一位 VTuber 的绊爱在最后一场演唱会之后进入休眠。 随后到来的 5 月,国内虚拟偶像 A-SOUL 因为中之人的薪资问题数次冲上热搜,其背后的经纪公司也因为之前号称的「虚拟偶像永不塌房」屡次被打脸

虚拟世界是人类通过技术手段将想象空间具象化。

来源 | FounderPark

2022 年 2 月,被公认为全球第一位 VTuber 的绊爱在最后一场演唱会之后进入休眠。

随后到来的 5 月,国内虚拟偶像 A-SOUL 因为中之人的薪资问题数次冲上热搜,其背后的经纪公司也因为之前号称的「虚拟偶像永不塌房」屡次被打脸。

虚拟偶像的 2022,并不顺利,还有二次元虚拟人和超写实虚拟人的技术路线之争,连带着虚拟人行业也充满争议。

虚拟人行业是不是已经有泡沫了?市场上也许并不需要这么多虚拟人?而在虚拟活动应用运营商超次元创始人 & CEO 陈坚看来,国内虚拟赛道即将迎来新的发展拐点。

我们到底应该看待超写实虚拟人?虚拟人行业的未来究竟是怎么样的?虚拟直播和元宇宙的关系又是怎样的?最近,我们邀请到了陈坚,还有超次元 A 轮的投资者声网市场生态高级总监杨慧,一起聊一聊虚拟人和虚拟经济的技术与未来。

1、只有和大平台深度合作,才能清楚他们在虚拟赛道上的真正布局。

2、目前虚拟人赛道过热,泡沫很严重,很像 2016 年的 VR 行业。

3、内容型虚拟人、身份型虚拟人、功能型虚拟人都没有任何依据可以证明越像真人成功率越高。

4、虚拟世界是人类通过技术手段将想象空间具象化。

5、如果把 iPhone 3GS 看成移动互联网到来的前夕,同样是 1000 万出货量的 Oculus Quest 2 是不是也代表了虚拟世界普及化的前夕?

01

超写实虚拟人并不是

行业的正确发展方向

Founder Park:最近虚拟人赛道由冷转热的背后有什么原因吗?

陈坚:有两个核心观点,可能和主流观点不太一样:

第一点我认为目前虚拟人赛道过热,泡沫很严重,很像 2016 年的 VR 行业。

第二,如果虚拟人脱离应用场景单独去提,其实是伪命题,大部分虚拟人项目没有前途。虚拟人未来是很多公司,比如影视公司、游戏公司或聚焦虚拟活动的元宇宙公司的一个基本能力而已,并不代表拥有这个能力就能成功。

任何泡沫底下肯定有想法的驱动。二十几年前互联网也曾爆过雷,泡沫破灭后回归到真实、正确的方向和发展节奏。虽然 2017 年 VR 行业爆雷,但爆雷后行业反而向更健康、正常的方向和节奏发展。虚拟人和元宇宙也会经历这个过程。我认为发展背后的必然性源于人类内心对更美好、更自由、更开放的世界的向往。

很多人会奇怪为什么有人喜欢假人,明知道假人背后是真人扮的,比如中之人、A-SOUL,为什么还喜欢?这其实代表虚拟偶像或虚拟人的 IP 戳中用户心中对更完美人设的设想。这种人设在现实中不容易获取,但虚拟的方式可以更好地戳中情感上的痛点。

远古时代为什么有《山海经》的存在?编《山海经》的古人也知道现实中没有这样的生物,但为什么编出《山海经》?大家可以理解成古人在当时的技术条件、客观条件下,只靠想象实现的元宇宙。随着技术发展,我们可以用更先进的各种 3D 技术、引擎技术、捕捉技术,把想象的东西更具象化。

Founder Park:你会怎么定义虚拟人?

陈坚:虚拟人的定义非常广,按我的认知和同行里的普遍共识做一个分类,我会将虚拟人分为三类:

第一类是内容或 IP 型虚拟人,像非常火的 AYAYI、柳夜熙等都可以定义为内容型或 IP 型虚拟人。内容型或 IP 型虚拟人的技术驱动方式并不绝对,因为做内容、IP 不应受技术手段的约束,关键是内容是否受终端用户喜欢,很多内容型或 IP 型的虚拟人是复合型驱动的。洛天依被 B 站收购后的驱动方式是复合型,既有预先制作的 CGI 流程的成果,也有用户 UGC 产生的作品,还有中之人驱动的实时直播,它是非常典型的技术复合驱动的 IP 型或内容型虚拟人。

AR 呈现的洛天依 | 来源:互联网

第二类是投资人最热衷的功能型虚拟人或服务型虚拟人,由 AI 驱动。

第三类虚拟人是我们选择的方向,叫身份型虚拟人,也可以定义为虚拟化身或 Avatar。比如这次直播的小狮子是我的身份型虚拟人,必须由我驱动。未来应该不存在身份型虚拟人了,因为每个人在虚拟世界里都会有自己的身份。

Founder Park:你怎么看待虚拟人背后的驱动技术和可能的发展方向?

陈坚:我认为中之人是一个过渡名词,未来肯定会消亡。但不代表 AI 会取代中之人,如果这天到来,可能是人类的末日。因为中之人建立的是虚拟偶像和人的情感羁绊,用 AI 代替情感羁绊,人类离灭亡就不远了。

像未来每个人有数字身份一样,目前身份型虚拟人的活动应用很少,例如直播、视频会议,但又不会每天直播和视频会议。想象一下,像《头号玩家》那样,用一个完全代表自己的虚拟身份逛街、看展、购物、看演出,感受和其他观众一起打 call 呐喊。这种方式有巨大无比的想象空间,给虚拟身份更广阔的应用场景。

即便有所谓的虚拟偶像,本质还是偶像或 KOL 的元宇宙形象映射。B 站有很直观的趋势,很多声优、up 主都采用虚拟形象出镜。未来由中之人驱动的内容型或 IP 型虚拟偶像的运营模式和现在会有质的变化,包括绊爱停止运作,前段时间 A-SOUL 出现问题等。对企业来说,内容型或 IP 型虚拟人的 IP 形象是归属企业的,但粉丝是因为中之人建立的情感,粉丝把他看成身份型虚拟人,这两者认知上的冲突导致各种矛盾。

绊爱,2016 年开始活动的日本虚拟 VTuber,公认的第一个虚拟 VTuber。| 来源:互联网

未来我认为虚拟世界中由中之人驱动的虚拟偶像会回归传统的经济逻辑,还是经纪公司的工作。虽然不可能发展成迪士尼这样的巨头,但一定会存在,因为有用户喜欢,发展成 YG 娱乐或 SM 娱乐这样的娱乐经纪公司也很不错。创业者不要再和投资人讲虚拟偶像永不塌房、IP 在公司手上控制力更强这种话,现在的投资人也不会再相信了。

对我来说,从来都是从虚拟世界的角度去看待虚拟人,而不是用虚拟人看待虚拟世界。我的目标是一个完全开放的高自由度、高互动的虚拟世界,《玩家一号》就是我的终极目标。根据这个目标去倒推需要有什么内容,再根据现有的技术条件来判断什么时候技术能实现怎么样的交互等,然后再去落地对应的应用场景和产品。

Founder Park:你怎么看待超写实虚拟人可能是虚拟行业未来的发展方向?

陈坚:首先,作为创业者,要时刻思考我们的技术、产品、项目会给市场带来什么价值,用户为什么需要我们的产品。内容型虚拟人、身份型虚拟人、功能型虚拟人都没有任何依据可以证明越像真人成功率越高。反观大厂的选择,A-SOUL 为什么做二次元风格,字跳团队肯定能做出超写实虚拟人,腾讯也做过非常写实的虚拟人。为什么他们做 IP 型虚拟人的时候不做超写实,而是做观影和质感非常写实但面相卡通的虚拟人。用制作人的话来说,是带给用户新鲜的熟悉感或熟悉的新鲜感,让用户处于虚拟现实很特别的边界体验。粉丝为什么要喜欢和真人一样的虚拟偶像,而不直接喜欢真人偶像,这是逻辑比较混淆的地方。

第二个是功能型虚拟人的问题,目前 AI 的 NLP 能力还是弱智能,只能在封闭语境下进行功能性对话,AI 驱动的虚拟人越像真人就越弱智,用户的包容力也越低;反而形象是 Q 版、卡通的,AI 能力不足,用户也会更包容。NVIDIA 主打 AI 驱动的虚拟人,但他们拿出来做演示的,不管是虚拟的 AI 老黄,还是后来点餐的虚拟助理,都是 Q 版卡通形象。

第三,对于身份型虚拟人来说,好不容易突破肉身限制,还要做和本人一样的虚拟人,简直是开玩笑。市场需求并不是越真实越好。在某些应用场景虚拟人是越真实越好的,比如 3A 主机游戏需要更强的用户代入感和沉浸感,像著名的《底特律:变人》,就是探索仿生机器人和人类共存的主题。某些特殊需求下需要高仿真虚拟人,UE5 前段时间放出黑客帝国的体验 demo,要创造真实和虚拟难以分辨的世界,就要用超写实虚拟人。

不可否认超写实虚拟人技术难度很大,但从商业运作角度,作为创业者要搞清楚超写实虚拟人在选定的应用场景下是否起到促进作用。很多超写实虚拟人都有恐怖谷效应。超次元做虚拟偶像很有名,很多人以为只能做二次元,其实我们做写实虚拟人比很多团队更好。但我们没有做绝对意义上的超写实,而是做美型写实,是人类希望自己更美好、更完美的样子。我们没有过于鼓吹超写实,它可以和现实更接近,比如大家所熟知的 VTuber 星瞳。

千万不要把虚拟人定义为越写实越有机会成功,如果你有独特的技术,可以大幅降低超写实虚拟人的技术门槛,比如有很厉害的三维扫描技术,可以一键扫描,而且做出来和本体的仿真度很高,是有可能的。但是如果是通过 DCC 流程,通过精细的三维制作不断磨细节,制造出足够真实的人,把这个能力当做自己的核心竞争力的话,一定会被市场吊打。

02

虚拟赛道即将

迎来发展拐点

Founder Park:可以抛开 VR、AR,直接做虚拟世界吗?

陈坚:可以。我们在 2020 年对日本的同类产品做过充分的调研分析,有两个样本产品,Cluster 和 VARK。Cluster 更注重 RTE(实时互动) 体验,强调每个用户必须有 avatar,代表用户的 avatar 可以在虚拟空间完成更多行为,用户是否用 VR 终端不是他们最关心的,他们有手机端、PC 端、VR 端。

VARK 更强调 VR 的全程近视体验,但缺少多元互动,感受不到一起看演出的用户,用户挥动荧光棒只是单机的行为。

充分体验后最理想的是 VR 设备的全沉浸感以及 RTE 的高维度交互。但目前不容易同时满足两个条件,国内 VR 设备是清一色的一体机,算力瓶颈比移动端更大。首先 VR 眼镜要算两只眼睛,边缘还有畸变变形,分辨率特别大,需要 PPI 视觉密度的运算,跑 60 帧以上甚至 90 帧才不算晕。

三维场景跑在 2D 屏幕,但把 RTE 做到极致;坚持使用 VR 设备,注重单人体验,不注重多人交互。虚拟活动中明显前者的持续沉浸感更强。如果用户只通过 VR 设备的光能刺激来获得沉浸感,整个活动将会是孤独的存在,没有和其他用户的交互,沉浸感很容易消退。但在 3D 场景里,用户能自由行走、控制行为,和很多用户实时交互,这种沉浸感是可持续的。

我们在客观条件限制下,优先满足多人实时交互,以 RTE 作为切入点,也做好了向 VR 端移植的可能性。今年 8 月份会进行 VR 端移植,不会急于在 C 端落地,会优先选择局部活动场景做实验性活动,大规模活动会优先在主机和手机上运行。

Founder Park:对于 Cluster 创始人加藤直人声称的的元宇宙构建经济圈很重要的说法,你们对此的思考是怎样的?

陈坚:很多人认为元宇宙只是游戏,其实不是。元宇宙使用的是游戏引擎,视觉和交互体验和游戏高度趋同,但元宇宙和游戏最本质的区别是:元宇宙里的内容未来由用户作为主导,游戏则是开发方主导的。游戏是极为重度的 PGC 内容,元宇宙未来会以 UGC 为主导,世界是所有人一起建设的,不可能只由一家公司建设。

有人开玩笑说 Roblox 是 4399 小游戏平台,但并不是,因为 Roblox 具备由用户创造内容的基本概念,Roblox 最近有大量游戏以外的应用场景,例如虚拟品牌概念店、虚拟商会、虚拟展会等。我认为判断元宇宙产品和打着元宇宙概念的伪元宇宙产品,主要看它是否支持用户创作,是否有足够强大的低代码工具,是否有更完善的引擎脚本工具可以让不同城市的用户参与建设。

我们的虚拟活动的应用也会在近期开始公测,内测和公测的主要区别就是,内测都是 PGC 的内容,但是公测时我们会配套推出一些低代码工具,让一些有能力的用户可以发布或者上架虚拟资产,也支持用户之间的交易。

我们和 Cluster 的策略不一样,Cluster 是全部先做 PGC 内容,做了一两年之后才推出低代码工具,而我们在进行整个产品的规划的时候就同步规划好了。这也是刚才所说的「时光机理论」,在领先地区已经存在的商业模式,我们可以减少试错成本直接进行消化。

Founder Park:什么是虚拟世界的本质?

陈坚:用比较哲学的话定义,虚拟世界是人类通过技术手段将想象空间具象化。

Founder Park:超次元判断国内虚拟赛道即将迎来发展拐点,依据是什么?

陈坚:并非是认为资本风口到了,我们的判断是虚拟世界在终端消费市场的变化,虚拟偶像只是虚拟世界的小部分,大的虚拟世界目前可以看到终端上的落地具备拐点的迹象。以三个数据为例:

一是 B 站的虚拟直播区,从 2019 年到 2022 年数据呈现 60 倍的增长,说明终端用户对虚拟人内容的消费呈现指数级增长。

二是 Meta 的 Oculus Quest 2 去年出货 1000 万台,现在已经超过 1500 万台。移动互联网以 iPhone 4 作为分水岭,iPhone4 的诞生标志着移动互联网时代的到来。但在 iPhone 4 之前,有一个机型是 iPhone 3GS。iPhone 3GS 是非常关键的拐点设备,它是全球出货量第一款达到 1000 万的智能手机,标志着智能手机从极少数的数码爱好者走向大众。如果把 iPhone 3GS 看成移动互联网到来的前夕,同样是 1000 万出货量的 Oculus Quest 2 是不是也代表了虚拟世界普及化的前夕?

VR 设备销量排行 | 来源:Counterpoint

三是数字时尚的兴起,超次元并非只做二次元,我们是专注在虚拟赛道。只是在目前的技术条件下不可能满足所有用户,特定的用户群对虚拟消费更容易接受,二次元用户是一个群体,VR 爱好者是一个群体,最近出现的数字时尚的爱好者也是。数字时尚本质上是给一些前卫的用户带来了更多的可能性,因为可以突破材料工艺和物理上的限制,在美的探索上具备更多可能性。数字时尚目前已经成为了新的社交货币。

从这三个维度来看,是觉得拐点即将到来,而不是因为资本的风口等原因。

Founder Park:超次元未来的发展规划是什么?

陈坚:目前以 PGC 活动为主,希望能是虚拟活动体验效果的标杆。明年一方面会更开放的引入各种创作团队,基于我们的虚拟活动应用创建活动、内容资产等。一方面会更激进地布局二次元以外更多的应用场景,目前市场反响非常不错。明年会在展览、电音、艺术、时尚等方面进行更多布局和尝试。争取在 2024 年做出新形式的平台,有很多创作者在里面创建内容、活动、自由的交易。合作伙伴想建设虚拟空间或虚拟活动,在我们的生态上发布任务,就有大量创作者承接,而不是像现在所有活动内容都需要我们的团队完成

03

线上虚拟活动

仍需技术升级

Founder Park:超次元对于虚拟活动的支持是怎么样的?和一般的直播活动有什么不一样?

陈坚:我们会提供一些场景模板,给用户一些简单的 DIY 搭配。比如说虚拟漫展里的展位,以及室外的蹦迪场景等。相比较堡垒之夜的演唱会,我们这边的动作是实时的,而不需要预先录制。

一般的虚拟直播都是平台捕捉有推送的视频画面,用户看到的画面是一样的,但是在一个 3D 的虚拟场景里,每个用户看的视角是不同的,要传输不同的画面,而且需要异地同步给所有在场景里的用户,需要非常大吞吐量的数据的并发处理能力。

目前官方引导的活动主要以虚拟演出和虚拟漫展为主,而我们作为承办方的话,活动类型会更加丰富,比如蹦迪、电竞赛事、观看球赛、博物馆和展厅等。只要是三维空间内有用户实时互动行为的活动都可以进行线上场景的迁移。

Founder Park:目前虚拟活动面临哪些技术挑战?

陈坚:目前虚拟活动有两大瓶颈:

一是算力,因为虚拟活动的画面不是在表演侧生成的,如果是在表演侧,性能不够可以升级,但是虚拟活动的用户实时交互数据,画面在用户侧生成。主流终端的配置会直接影响用户体验。怎么跑多个 avatar、三维场景和大量实时数据的交互,是渲染底层和资产优化的难题,尤其是跨终端渲染。

二是 RTE(实时互动)领域。如果做一场复杂的虚拟演出,表演者是实时动捕的,要同步的数据就会非常多。首先是最基本的说话声音,RTC(实时通讯)涉及到的语音互动,还是 3D 空间音效,要根据用户的距离判断音量。如果终端是 VR 设备,还要判断方向,这部分的运算量也非常大。

再者是用户状态,用户是在鼓掌还是在向前、向后走,涉及用户状态的同步,我们没有用网游的一般方案,因为网游分服分房间并不适合开放的虚拟世界,这里采用声网的 SD-RTN™方案,综合比较过,声网的 SD-RTN™方案最适合做元宇宙应用。

还有,虽然同步的不是视频画面,但在带有虚拟屏幕的虚拟场景里,比如虚拟电竞馆实时播放游戏画面,涉及到视频的传输,延时要控制到毫秒单位,正常 100 毫秒内才有身临其境的即时互动感,所以还是会有 RTP(实时传输协议)的存在。

最后是超次元特有的,声网也在研究的更高维度的结构数据。实时捕捉到用户虚拟形象的动作和表情,同时映射给在场的所有用户,数据的吞吐量和运算量非常大。完整虚拟角色的全身骨骼、双手手指再加上最基本的 55 个表情通道,按一秒钟 60 帧计算,数据量是一秒钟 100 多 M,可能 6G 技术都无法传输。我们用了几年时间迭代,把每秒 100M 压到每秒 1M,可以在网上并发传输。但如果有两个表演者,100 个观众里捕捉打 call 的动作,数据的交互会是几何级的增加。所以我认为 RTE 有巨大的升级空间,包括最基本的音频技术。大家可能认为音频通讯已经很成熟,但放在高维度的实时交互场景里,单是 RTC 音频通讯就有巨大的课题要研究和攻克,这方面需要像声网这样的专业 RTC 厂商帮助行业向前发展。

杨慧:从我的行业角度,很多在技术研发角度遇到的痛点问题,背后代表的是实时互动发展的现状。实时互动作为一个独立的概念,和传统的 RTC 实时音视频不同。最大的区别是以前强调的是在线连通、语义传达能实现就可以。但现在要同时传输多种数据,反映音视频和虚拟场景的空间、虚拟道具和虚拟角色、主播和用户等之间的关系,实现粉丝在偶像现场的临场感;同时传输的数据包括偶像的动作、表情、粉丝的状态、粉丝和偶像的互动以及粉丝和空间的关系,空间还有动态图像等,这是非常复杂的场景。

目前在实时互动行业,每天都有相当量级的新场景诞生,比如教育行业的实时监考、职业教育的操作考试认证,传统的数字化转型的金融等行业。从最基本的技术架构,到单向技术的优化,尤其是结构化数据这种高维度、高并发场景的优化问题,都是复杂的系统工程问题。

而由于实际体验的不断提升,用户不再接受分房间的处理方式。规模持续扩大需要线上体验无界限感、无地理位置的跨度,千万人同服的感觉,真正实现在场看到旁边的人激动地打 call,而不是过段时间就刷出其它房间分过来的新人。每个实时互动的终端用户接入现场的方式都不同,所以要求实时互动技术能兼容不同的 PC 端、手机型号、系统版本号以及不同的硬件设备版本,对兼容性的要求越来越高,如何更好地挖掘终端设备的体验适配、交互方式,技术上的要求是很高的。

另外还需要行业内生态的一些动作,这也是最近行业内蓬勃发展的新潮流,各家都在丰富功能组件,涉及很多上下游实时互动的玩家,包括画面增强型的美颜,粉丝上传自己的头像,需要美颜或动捕或 RTM 实时信令的组件展示粉丝的形象,包括举变换字白板作为打 call 板等。每个功能和组件都有专门的团队进行开发,我们兼容所有技术,把传统的单向运营变成生态化,把生态上下游企业的场景创新变成声网生态化压力打法最主要的部分。这些也对实时互动的所有从业者、应用开发者以及底层技术提供者都提出很高的要求。

Founder Park:声网最近发布的实时互动报告里关于未来的趋势是什么样的?

杨慧:首先实时互动作为新兴概念,发展非常迅速,从 2015 年中国第一个实时音视频产业大会,到现在六七年的时间,实时互动的渗透率达到 30% 到 40%,未来可以看到更高的底层技术。可以说在很长一段时间内会看到实时互动的复杂性和快速成长性。从行业发展趋势来看,实时互动将是量级非常可观的行业,预计 2025 年在全球范围内会是千亿级别的市场,将撬动直播、虚拟偶像、企业远程协作等接近万亿级别的行业。

此外,现在的应用百家齐放,巨大的行业图谱涵盖几十个行业甚至几百上千的场景。近几年越来越多的线下场景无缝衔接到线上,不只是线下的简单替代,而是线上让人有身临其境的感觉。开发者的门槛也越来越低,得益于整个行业、各功能组件以及开源软件开发者的共同努力,把开发者需要的开发环境和小组件都成熟化地提供给大家。

还有就是「软件吃掉世界」,我们认为未来的软件、实时互动相关的基础设施、边缘计算、网络优化的 AI 算法以及 Codec 编码成熟后的实时互动体验会更好,软件的功劳会越来越大。另外我们会有更多超越现实的体验,比如和偶像在一个虚拟场所互动,近距离看她唱歌,她的裙子能随心情变化,这一点现实世界很难实现,但在实时互动的条件下实现超越现实自然感觉的体验,可能短期内就能看到。

另外在技术框架下,我们可以实现全球同服、交互不分区、人数无上限等方面的体验,这是可以近距离看到的发展和可预测的趋势。对于企业运营的趋势,越来越多的实时互动行业的从业者、大厂会构建自己的垂直领域生态,服务更多应用开发商,共同助力行业的繁荣。

Founder Park:你目前最关注实时互动哪方面的技术突破?

陈坚:目前还是高并发的流媒体技术。比如我们开通了 RTC 语音通道,一个频道 3 万人同时在线是没问题的,但开麦人数有限制。因为数据的发和收是两个概念,如果一个频道里发和收的用户都非常多,会呈现几何级的增加。目前通信频道里,收的并发数较高,但不管是音频、视频,还是动捕面捕的结构数据,在发的方面还有较多的局限。我们希望 RTC 领域在发送方面可以有重大突破。

比如说举办一个线上的虚拟漫展,场馆里逛展的用户,同屏密度是很大的,而且随着逛展路线的迁移,同屏人数不停在变化。目前我们是通过产品侧解决问题,把一个大空间分成很多区域,进入 1 号区域时用 1 号线路,到 2 号区域时会自动切换到 2 号线路,解决了同时开麦人数的局限问题。通过产品设计的角度规避技术条件的限制,还是希望技术底层能给我们更多的发挥空间,少一些妥协。

04

选择虚拟直播作为

虚拟世界的切入口

Founder Park:超次元这个名字有什么来历?

陈坚:把公司名字定为超次元是有一个愿景,希望通过技术打破次元壁,做出一个超越次元界限的虚拟世界。超越次元无界限,缩写就是超次元。

Founder Park:看你的个人经历,大学时修的是建筑学专业,为什么选择建筑学?建筑学对你的创业有哪些帮助?

陈坚:建筑学并非是我个人的选择,因为我考大学是 97 年,那时家长的意见对孩子选择专业非常关键,不像现在可以由学生自己选报专业。家里认为我的数理化成绩很好,又会画画,建筑学是热门专业能赚钱,于是就选择了建筑学。

以前没有产品经理专业,建筑学是我所知道的专业里最有产品思维逻辑训练的学科。建筑学会分析用户的需求、制作类似产品需求的任务书、分解任务、制定 timeline,还有一些跨学科协同,像土木工程、环境园林等。现在做产品要跨客户端,服务器还要跨美术 UI 等。这部分的学习经历对我从事虚拟行业产品经理有很大的帮助。虽然我是创始人,但我在公司里的角色更像是产品经理,这也是团队对我公认的定位。

Founder Park:早期创业的时候是基于什么样的认知?

陈坚:如果将时光机理论*定义为方法论,可以说这是支撑我十几年创业决策的关键性方法论。学建筑一方面让我具有产品经理思维,另一方面建筑学其实是中国最早规模化应用 3D 技术和引擎的行业,并非是大家印象中的影视或游戏行业。我前两次创业都和建筑相关,运用 3D 技术作为基础。第三次创业我不希望再和建筑有太直接的关系,就考虑跟个人的二次元兴趣相结合。

时光机理论:孙正义提出的时光机器理论,「充分利用不同国家和行业发展的不平衡,在发达市场获取经验之后,再去开发相对落后的市场,就仿佛坐上了时空机,能穿越过去和未来。」

2013、2014 年国内互联网还不是很发达,二次元还是小众词汇,可能 99% 的投资人都没听过。这种情况下,现有市场很难找到有价值的参考,所以去了香港进行市场调研,香港市场上有一款日本万代的产品——AR Carddass,是将收藏卡和 AR 技术以及二次元 IP 进行结合。这次创业我想延续 3D 虚拟技术又想结合个人爱好,根据在香港采集的日本市场很领先的产品,把这个理念带回大陆进行创业,所以我第三次创业是从 2014 年开始的。

这次创业切入的是 AR、VR 领域,同时又需要对二次元文化有较多了解。实际入局是在 2015 年,伴随着国内很多行业的兴起和发展,比如 AR/VR 行业、二次元、移动互联网等。

Founder Park:早期创业阶段有踩过坑吗?

陈坚:踩过最大的坑是 2016 年创业心态上失去初心,很多东西围绕资本所谓的风口而忘记做项目、产品最终能给用户带来什么价值。在这种心态失衡的情况下,做出了很多错误的决策,对 VR 在 C 端的落地进程做出严重误判。我经常开玩笑说现在是第 3.5 次创业,这次创业我会有自己的思考,不管资本风口吹得多热,媒体怎么吹捧,我都会冷静思考从事的方向能给用户带来怎样的核心价值,市场和用户为什么选择我们的项目、产品。

第二点是准确预判技术落地的时间节点,如果想等技术成熟后再介入肯定是滞后的,不会有机会。如果对技术落地过于乐观而做出失误的预判,也会带来毁灭性打击。第 3.5 次创业进入虚拟赛道,2017 年重新规划定位后,我非常自豪不管资本上的声音如何,都坚持自己的选择方向、态度节奏。有几次对行业的发展时间点和技术落地时间点预判得非常准,能提前一年到一年半的时间进行对应的研发布局。

2016 年在 AR、VR 领域犯了巨大的决策错误,导致融资的 2000 万全部烧没,团队从 100 多人掉到 30 多人。这种情况下,非常感谢投资方的 300 万救命轮,让我转型。此后五年时间没有融资,凭借这关键的 300 万,2017 年押注在虚拟人直播的赛道上,不仅解决了生存问题,还解决了发展问题,通过市场上的营收获得发展,收入也翻了 10 倍,这和时间迁移理论有很大关系,那时的参考和对标对线是日本市场。

Founder Park:最开始决定转型做虚拟直播,当时会认为这个领域比较小吗?

陈坚:当时选择的原理是小切口大场景:

首先切入点很小,因为当时没有其它选择,不到三百万的资金和二三十人,不可能选择大赛道,关键是生存。但生存只是一个手段不是目的,创业是为了发展,从小切口切入可以最快解决生存问题。

第二点虽然是小切口,但重要的是当时的虚拟人直播或 VTuber,让我看到未来的很多可能性。一是虚拟 IP 会改变粉丝互动的形态,可以用短视频高频输出,用直播实时互动的方式和粉丝、观众建立联系,同时有可能改变 IP 的打造方式。

另外 2017 年是行业关键的时间拐点,直播和短视频兴起。选择 VTuber 直播很垂直的一个原因是可以短时间解决生存问题,后续发展也有更多可能性。也正因为 2017 年是 all in 在 VTuber 直播上,2018 年推出的时候立刻就签下网易、腾讯、阅文、咪咕等大客户。经过半年时间的推广,团队逐步走向盈亏平衡的状态。

Founder Park:前期主要偏 ToB 业务,积累了哪些经验?

陈坚:有几方面重要的积累:

第一是让我们的产品、技术和团队经验打磨得非常成熟。

第二,当做偏 C 端业务时,过往的 B 端合作会起到很好的反哺作用。因为 C 端业务要和一些平台合作,很多平台是曾经的客户,对我们的技术能力、执行力、审美以及对终端用户的把控都很清楚,给予我们很多信任度,合作会更流畅。

第三,过往做大量的 B 端业务,尤其是互联网平台的合作,让我们获得高度且全面的行业视角。只有和大平台深度合作,才能清楚他们在虚拟赛道上的真正布局。对创业团队来说,怎么找准切口和定位,在夹缝生存之余还能有所发展,起到关键作用。如果通过媒体了解大厂的布局,要么信息是滞后的,要么很多是包装后的信息,不一定真实,至少不是完整的,很多核心信息不可能由媒体报道出来。

*以上嘉宾观点不代表 Founder Park 立场,也不构成任何投资建议。

*头图来源:VSINGER

极客一问

虚拟人赛道在未来

会有怎样的发展趋势?

关键词

24快报
JSON抓取失败