数字人

百度李士岩:实现数字人自由,在不远的未来

当元宇宙变得人尽皆知,全球科技巨头陆续宣布布局元宇宙相关产业的当下,人们对数字人的想象再大胆都不为过。那些充斥在科幻影视作品中的赛博朋克场景仿佛近在咫尺,并自然成为人们对元宇宙的幻想模板

“零门槛、低成本的数字人直播时代已经到来。”百度数字人与机器人业务负责人李士岩在百度智能云曦灵的新品发布会上如此宣称。

9月27日,百度智能云发布了“数字明星运营平台1.0”“数字人直播平台2.0”两大数字人新品,只需一台笔记本电脑、一个摄像头即可一键秒级生成六大风格超高精人像,实现虚拟开播。

这些乍看之下令人摸头不着的技术创新究竟意味着什么?会后,李士岩就数字人面临的发展更迭、落地瓶颈及行业渗透等问题,与银柿财经展开一场对谈。

理想与现实的差距

元宇宙变得人尽皆知,全球科技巨头陆续宣布布局元宇宙相关产业的当下,人们对数字人的想象再大胆都不为过。那些充斥在科幻影视作品中的赛博朋克场景仿佛近在咫尺,并自然成为人们对元宇宙的幻想模板。

但是,现实世界的技术武装显然还与理想相差甚远。目前已有的对元宇宙、对虚拟人的呈现更多只出现在影视化的科幻视频、尚不成熟的游戏设定当中,作为真人参与元宇宙世界的虚拟分身,数字人会是什么样、能做什么、将走向何方,都是亟待解答的问题。

图片来源:每日经济新闻资料图

为方便在实际中理解数字人,李士岩在纸上画了个简单的价值模型,由下至上分别是IP价值、内容生产、多模互动三层,“IP孵化需要生产内容,而IP孵化成功后又可为内容赋能,通过与观众互动数字人又可形成价值,三者交互产生共振效应。”李士岩边画边解释,“我们认为,数字人很大部分的价值便来源于这种共振。”

对应三层价值,目前,数字人已经在几大场景中得到应用。IP价值上,百度数字人扮演了虚拟带货主播的角色,内容生产方面则为广电行业提供了虚拟主播,尤其是手语主播。此外,有赖于多模态交互能力,百度数字人还与银行合作用于服务用户。

当然,对数字人的设想远不止于此。现有的数字人IP往往留给人呆萌、不够智能的印象,对此,李士岩表示,数字人行业的发展目前还受制于三个因素:“一是成熟的技术平台提供低成本的AIGC(人工智能自动生成内容)内容生产;二是有赖于计算平台迭代的硬件生态的成熟;三是数字人商业化应用场景的广泛性,还需要更多生态伙伴加入、探索。”

“这个行业现在很喧闹。”李士岩坦承,“很多影视公司也切入这一赛道,但数字人是一个典型的技术驱动型产品,技术不成熟,就只是个动画片。这个行业是需要去伪存真的。”

未来的数字人会是什么样子,可能与现实中的、幻想中的都不尽相同,在更高阶的数字人到来之前,百度的选择是埋头苦干。

百度走到哪了?

“百度在超写实数字人这条赛道与竞争对手存在代差,我们是遥遥领先的。”李士岩不无自信地说道,百度已经在这条赛道做了四年,自2018年切入之初就处在3.0超写实数字人阶段。

据李士岩介绍,数字人的发展已经经历了三个阶段。1.0阶段止于没有互动能力的虚拟偶像,2.0阶段虽可实现1对N的交互,但其形态仍然是卡通化的,而3.0阶段的主要特征,一方面是生产端的超写实人像,另一方面是交互端N对N的互动能力。

随着AIGC在内容生产中所占比例越来越大,百度的数字人目标定位为“每个人都能以非常低的成本孵化其数字分身,同时通过与具有强对话能力的数字人互动来获得服务”。至少从目前来看,百度在这两方面都取得了可喜的进展。

基于百度百亿级参数的Plato-XL大模型和UNIT7.0对话系统,百度数字人的对话能力已“可以做到千人千面”。更重要的是,最新发布的百度数字人平台标准化产品的年售价被控制在10万元以内,从前动辄上百万的报价一去不复返。

在问及低售价是否意味着对部分技术的筛除时,李士岩表示,“我们没有任何技术保留,现在已经把几乎90%的可被标准化的能力都放到平台中供用户使用,未来会根据技术成熟度,将越来越多高端技术放进平台中。”

李士岩认为,“产品的技术成熟有助于推动场景的进步。如果非要说数字人在推进过程中存在什么难点,那就是市场对这件事情的感知度还不够真切。”

而百度的目标是让数字人成功渗透进各行各业。李士岩向银柿财经透露,“智能驾驶和自动驾驶已成为势不可挡的潮流。百度数字人作为提供个性化服务的重要载体,目前正与客户合作汽车智能助手相关应用,未来汽车赛道会是我们的一个重点方向。”

关键词

24快报
JSON抓取失败