产业

奥丁科技为元宇宙“造智慧人”

奥丁科技希望基于自研的硬件、软件、算法和AI等综合能力,让数字人更加逼真和智能,并通过仿生学和人类学研究不断降低成本,增加产能,完成超写实数字人的普及。

在当前大热的元宇宙话题下,数字人似乎也成为了焦点。究其原因,在过往的PC互联网和移动互联网时代,主要的信息载体是图片、文字,因此交互方式以电脑鼠标和手机触屏为主,但这种交互方式与人真实的交互习惯相去甚远。

奥丁数字人歌手

而如果将数字人视作新一代交互载体,其以语言、声音和动态的三维视频图像为主的交互方式,无疑更接近真人,也契合了元宇宙颠覆移动互联网的设想。

但另一方面,颠覆性的想象意味着前所未有的难度。当前的数字人赛道看似风光无限,但从呈现效果、制作周期、制作成本等多个角度,数字人好看的皮囊,以及「智慧」程度都还远未达到「元宇宙人」的级别。

「新声Pro」找到了为某卫视综艺节目虚拟艺人提供数字化服饰技术的团队,面对尚处野蛮生长的市场和众多概念公司,奥丁科技一直基于自研的硬件、软件、算法和AI等综合能力,让数字人更加逼真和智能,并通过仿生学和人类学研究不断降低成本,增加产能,完成超写实数字人的普及。公司经过2年多的研发,正式推出了奥丁数字智慧人。

奥丁科技数字人Yola

奥丁科技业务负责人张玥说:「某种程度上奥丁科技算是个异类,因为我们不习惯按行业原有的方向前进,而更希望通过自身数字人底层技术的突破,成为整个行业的破局者,真正地为元宇宙造仿生学智慧人。」奥丁的名字也是借鉴了北欧神话中众神之父奥丁赋予人类生命和灵魂之意。

不赶风口,只讲需求

一方面,现在的数字人与元宇宙似乎呈现绑定关系,众多从业者及投资人纷纷跑步入场,唯恐错失良机。一时间做数字人不提元宇宙者,颇有与时代脱节之嫌。

但另一方面,需要明确的是,元宇宙代表的是对未来美好愿景的集合,其中所涉及到的VR&AR、AI、引擎、动作捕捉、3D仿真等诸多先进技术,即使没有元宇宙的概念,也会稳步向前发展,数字人技术便是其中典型。

张玥表示,奥丁科技团队已经在这个领域投入科研2年多,并不是盲目追逐元宇宙的风口,公司对数字人一直保持着底层技术的研究,已经扫描制作完成上百个数字人模型,其中还包含诸多明星。

数字艺人复原

根据奥丁科技的观察,市场对数字人有很大需求,而且需求长期存在。

市场研究机构量子位发布的《虚拟数字人深度产业报告》指出,预测到2030年,中国虚拟数字人整体市场规模将达到2700亿元。

首先在传统的游戏领域,作为目前数字人应用最多的场景,在游戏中数字人可以作为游戏角色存在,或担任游戏NPC,对玩家完成任务指引,提升玩家游戏体验感。而跳脱出游戏范畴,在其他领域,数字人也有广泛的应用场景。

以服务型数字人为例,大体可分为虚拟偶像,虚拟主播,虚拟导览三大类。其中虚拟偶像可以服务于音乐、影视、MCN机构,生产优质内容;虚拟主播则可应用于电商、短视频、游戏直播等领域,创造经济效益;虚拟导览则可用于政府代言,虚拟导览,提供便民服务。

虚拟手语主播

但旺盛的市场需求背后,是贫瘠的数字人生产能力。

在加盟奥丁科技之前,张玥曾担任文投控股(成龙耀莱文化)总经理,并主导并购了世界第三大特效公司Framestore。20年来对公司战略,市场和运营管理的经验,以及丰富的海外工作背景,让张玥对影视特效、游戏以及AI的新动向非常敏感。

她发现如果以传统的电影特效制作数字人,制作过程需要用CG技术一点点精雕,虽然呈现效果优质,但数字人的制作成本非常高昂,好莱坞有时一秒镜头可能耗资就在百万美元,而且制作周期很长。

既然市场存在需求,且现有的技术方案无法解决,自然意味着更大的发展前景。

技术极客

在决定进入数字人市场后,奥丁科技很快确定了公司发展的方向:分阶段「做表演级的数字智慧永生人。」

第一目标是数字人先能表演,不仅要在皮肤、头发、衣着等外表上与真人形似,还应该能通过一颦一笑、伤心流泪等表情传递情绪,达到神似的效果。而且整个生产过程应该又好又快,最终达到可批量化生产超写实数字人。

奥丁国风数字人表演

第二目标是整合多种技术实现数字人的智慧,由AI学习系统、脑科学和语言声音系统共同完成。最终目标则是数字永生,也就是赋予未来的数字人「灵魂」,让其拥有性格与思维,并可以自我进化。

在当前数字人市场上,以单点打爆做IP营销者有之,也不乏批量化生产较为粗糙的二次元虚拟形象者。但如奥丁科技定位在生产超写实数字人,同时要兼顾产能和效率的公司,其实并不多见。

奥丁科技首席技术官 Grissom介绍说:「我们做事方式很独特,因为我们不会觉得行业都这么做,就应该如此。对奥丁科技来说,不仅要把数字人做好,还应该以技术极客的方式做好。」

奥丁科技技术极客的风格与其团队构成有很大的关系。

奥丁科技身后有两位参与创办公司的天使投资人,一位是华文创投的创始人姜山,有20年互联网科技和文娱产业经验,坚持以科技与内容为核心,围绕年轻人未来娱乐消费场景投资,孵化新物种新模式;另一位是智慧基石创始人雷鸣,是百度七剑客之一,北大人工智能创新中心主任,一直致力于AI领域研究。同时奥丁科技的产品负责人Grissom是做游戏出身,曾担任过Gamebryo引擎的亚洲区技术支持,也做过硬件和驱动技术,拥有综合的技术能力。

奥丁科技自研多款应用工具

据「新声Pro」了解,目前奥丁科技的团队规模在50人左右,其中研发人员占比在90%以上。

奥丁科技首席技术官 Grissom表示,公司在搭建团队时,所挑选的都是各方面的尖端人才,所涉及的面也很广泛。既有做电影特效出身,把握镜头和呈现效果的技术人员;还有一部分是IT人才,负责软件和算法优化;还包括一些硬件公司的人才。「我们从硬件到软件到算法都有团队。」

扎实的研发团队,让奥丁科技科技可以通过技术革新,解决大量数字人市场上存在的困局。

在最直观的静态呈现方面,当前数字人的呈现效果并不理想,尤其是在对真人的还原上,大部分还是偏重于二次元风格的设计。

以数字人的面部效果为例,原本要达到影视级的皮肤、毛孔细节,需要艺术家花费大量时间进行雕刻。而奥丁科技则可以通过画面捕捉、体感控制及画面渲染技术,还原数字人面部的各个细节,让数字人纤毫毕现。

奥丁数字人面部细节

在具体操作步骤上:奥丁技术团队会使用自研的硬件设备,配合数据采集手段完成数据扫描,之后结合数据处理系统,和深度学习的算法,还原数字人皮肤和毛孔细节。保证生产的数字人模型在拉到近景特写后,毛孔和皮肤纹理等细节都可以真实还原。据悉,奥丁科技的3D数字资产积累已经达到了十几T,在行业内是极为少见的。

除了静态呈现,数字人还面临着另一个更高维度的技术难题:无法做到对真人表情的还原,从而传递情感。即便是由Epic出品的全球顶尖虚拟形象生成软件Metahuman,其所制作的数字人也无法传达微表情。

Grissom表示,在经过详尽的市场调研后,他发现市场上主流做数字人表情的思路,都是「最终呈现」。也就是说观众看到的只是一个单纯的笑容,或者流泪表情,而并不是一个从不笑到笑,从不哭到哭的动态过程。但在现实情况中,人的情感波动再由表情传达,必定是一个动态变化的过程。

因此奥丁的思路是还原表情的变化过程。为此团队推出了「表情方案+表情驱动」的解决方案。

通过自主研发的硬件设备,微表情级别的数字人面部捕捉系统,配合绑定系统以及面部驱动方案,奥丁科技可以让数字人表情还原度超过90%,且具有一定的表演能力。

匹配应用场景

张玥表示,「数字人市场有很大的想象空间,在完成一定的技术积淀后,奥丁科技希望将成熟的技术匹配到更大的应用场景,同时研发新技术,去引领应用场景走向新阶段,最终由TO B走向To C,这个战略公司会长期坚持。」

在当前阶段,奥丁科技技术的主要应用场景,还是在服务B端客户。

据「新声Pro」了解,目前奥丁科技已经与多位行业客户进行合作,包含影视、电竞、音乐、动画、电商、短视频、直播、综艺、文旅、奢侈品等。比如为影星克拉拉打造了完整的面部、肢体、表情等全部数字人资产;为《前沿访谈》打造商业大佬们的数字分身;数字服装潮牌;为NFT产品提供虚拟场景。

奥丁科技首席技术官 Grissom透露,在为某卫视综艺节目虚拟人制作全套服装时,由于需要配合节目的录制档期,同时还要在录制现场虚拟人和众多真人明星完成互动,对时间要求非常迫切。最终的结果来看,奥丁的数字化服装和绑定的呈现效果收获了众多好评,传统的虚拟人制作公司需要3月的时间,而奥丁利用自己的材质硬件设备开发周期仅在1周左右,并用于直播,完成了客户紧急要求,这些都离不开奥丁科技在技术端的创新。

姜山、吴历华数字替身出现在 EDG 电竞节目中

当前阶段,数字人在进行模型制作和数据采集时,主流方案还是大量采购单反相机组成3D矩阵,辅以人工大量修复,这样的操作流程无疑需要更高的时间成本和人力成本。而奥丁科技通过自研的虚拟技术系统,让数字内容在研究、制作、使用等各个环节变得更加规范,可以通过标准化操作提升效率。

Grissom表示,由于整个公司90%都是技术极客,因此做事的方式就是会把任何一个重复的劳动变成程序化操作,「只要是电脑能干的事我们就绝对不用人工。」同时内部有一套自己的工作流程,除了人工处理数据修复的部分,团队在平时就会大量去做内部的工具,因此团队的执行能力和生产效率都很高。

除此之外,奥丁团队还对接了工业生产中服装建模的流程,可以完成工业级别的服装仿真结算。相比于传统的3D建模软件,对接工业设计模型既能让数字人服装的物理真实度更佳,也能使服装生产效率得到提升。

服装布料系统

张玥认为,尽管目前公司以服务行业客户为主,但根据不断升级的技术能力和奥丁对数字人四个阶段的规划,公司未来会进入更广大的C端市场,真正完成数字人的普及和生长。当前公司拥有的多项硬件与软件知识产权;可服务于AI深度学习的3D数字资产;影视级面部及身体动作捕捉系统等一系列技术优势,都将继续迭代,以数字人为入口,面向下一代高互动性的VR内容。

24快报
JSON抓取失败