◎2022年来,越来越多的数字人走入千行百业、投入实际应用,大规模商业化就在眼前,行业同样在思考,数字人行业还有何难点、如何解决、未来数字人又将向何处去。
每经记者 可杨 每经编辑 陈俊杰
元宇宙概念里的数字人正在走入“真实世界”。
百度AI数字人希加加成为数字人嘉宾,商汤的虚拟员工“小宁”线上线下全方位赋能传统银行,小冰打造的虚拟歌手陈水若登上了广东卫视春节晚会,每日经济新闻的虚拟主播24小时播送新闻……在越来越多的行业里,人们正在习惯数字人的存在。
2022年来,越来越多的数字人走入千行百业、投入实际应用,大规模商业化就在眼前,行业同样在思考,数字人行业还有何难点、如何解决、未来数字人又将向何处去。
百度:数字人从概念走向实用
百度AI数字人希加加/受访者供图
在2月末召开的2023全球人工智能开发者先锋大会(GAIDC)上,作为大会邀请的数字人嘉宾,百度AI数字人希加加以AIGC首席架构师身份发表演讲,为人类嘉宾朋友们讲解百度文心大模型在AIGC领域的运用,分享她的“心路历程”。
这是百度数字人在各行各业应用的缩影。
百度智能云AI应用产品部总经理刘倩介绍,过去一年,百度与各行业的客户携手打造了多个数字人,例如在广电及媒体领域,冬奥期间,与央视新闻合作了AI手语主播,为听障人士提供了有温度的赛事观看体验。央视网数字主播小C,连续两年两会期间采访对话人大代表。在虚拟偶像领域,百度推出了像百度品牌代言人希加加这样纯诞生自虚拟世界的IP。
另外还包括数字人健身教练、数字人导游、数字人导购、数字人办税官等等,百度智能云打造的多个数字人,已经广泛应用在金融、运营商、政务、文旅、广电、互娱、航天等领域。
此外,2021年底,百度推出百度智能云曦灵平台,集数字人生产、内容创作、业务配置服务为一体,来实现数字人的高效生产、智能驱动和低成本运营。刘倩介绍,过去一年,曦灵平台的产品不断丰富和迭代,分别发布了AI手语平台、数字明星运营平台、数字员工平台、数字人直播平台等。以AI手语平台为例,可以直接实现文本转手语、视频转手语、语音转手语,甚至是节目直播只要接入手语平台,即可在画面上实时生成数字人手语播报。
在刘倩看来,数字人不管发展到什么阶段,一定是为了更好地服务人类和创造更大的价值,2022年,数字人正在从概念进入实用阶段,形态和应用场景也将不断丰富。“作为从业者,我们认为数字人发展的目标,其一是在于把人从枯燥、重复性的工作中解放出来,便于人们做更具创造力的创意工作;其二是在于陪伴和寄托,在数字世界或元宇宙,让人类有一个更好的伙伴或自己。”
刘倩认为,想要提供服务,或者是提供陪伴与寄托,就需要数字人不仅仅停留在有人的外观、行为上,更要具备人的思想,并且能实现高频的互动以及内容输出。“目前我们看到行业中,还有很多数字人的成本、制作周期非常高,比方说给数字人换一套服装的成本是几千到几万元不等,时间上也有几个星期甚至一个月。这给了我们一个很大的启示,一个技术想要真正广泛应用到各行各业,降低其门槛和普惠化是必经之路。”
刘倩介绍,从数字人市场规模来看,虽然各个机构预测维度不同,但都呈现出中国数字人市场蓬勃发展的趋势。例如有智库(量子位智库发布的《虚拟数字人深度产业报告》)预测,2030年,中国虚拟数字人整体市场规模将高达2700亿。IDC预测,到2026年,企业级市场数字人相关的市场规模将达102.4亿。同时,因为数字人自带科技感与话题热度,在2022年形成了多个营销热点。数字人已经应用在偶像IP、品牌代言人、直播带货、主持播报、企业服务等场景,可见数字人的商业价值正在被验证。
“数字人到底聪不聪明,取决于交互。”刘倩进一步介绍,百度即将在3月推出基于百度智能云技术打造出来的大模型“文心一言”, 这类生成式AI产品,一方面能提升数字人自己的经验和认知,迅速打造不同领域的“专家”,同时还能开创人格化数字人的创意空间。到那时,人们可能很难判断,屏幕之后的究竟是数字人,还是素未谋面的网友,数字人和现实人类之间的界限将被模糊。
商汤科技:虚拟人如何赋能百业
商汤科技为宁波银行打造的虚拟数字员工小宁/受访者供图
2022年,商汤科技为宁波银行专属打造的虚拟数字员工“小宁”上线,基于商汤原创的“虚拟IP解决方案”及多种领先的AI技术,可以实现高效率、低成本的AIGC内容创作,助力银行实现前端业务的用户积累和营销转化。
“小宁”也是商汤科技AI数字人“虚拟IP”在“线上”营销场景中的首次应用,据介绍,商汤数字人“虚拟IP”可以自主直播运营,从粉丝互动到直播带货,用更低的运营成本为企业前端业务带来全天候的“用户触达”,不断增强品牌粘性,为品牌带来持续增值。
商汤科技数字文娱事业部总经理栾青在接受《每日经济新闻》记者采访时谈到,商汤科技在数字人应用的探索,主要期待解决两个场景,一方面是各种各样以人为核心的视频的快速生成,另外一方面是以人为核心的人机交互能力的提升,包括多模态的人机交互、自然语言处理等方面。以宁波银行的虚拟人为例,在栾青看来,线下能够帮助日常的银行客户回答问题;线上能够快速的制作各种营销视频内容,帮助企业更好地宣传,这是数字人能够最终带来的核心价值。
栾青觉得,商汤对于数字人的探索,更多看重数字人是否能够进入具体的场景落地,比如银行、短视频等,“真正走到大家日常生活中,帮助中小企业更好地与客户交流,提升日常运营效率,降低运营门槛和成本,这是我们认为最好的数字人。”
在栾青看来,在数字世界,无论是生活还是工作,虚拟人都是最大的主体,从这个主体出发,必然有提高其使用效率、让其更好地服务大众的方法。“至少慢慢的每一个企业都需要一个数字人,直到最终,每个人在工作和生活中也可能需要一个数字人,这其实是一个非常大的市场前景。”
而商汤的目标则是希望能够让更多中小企业使用数字人,在栾青看来,这意味着科技能够普惠大众,科技能够有更高的运营效率,更低的运营成本。
谈及商谈科技2022年在数字人层面的探索,栾青表示,首先从技术实力与综合能力层面,商汤数字人确实获得了行业认可。但同时她也提到,2022年,整个行业对于“数字人究竟应该如何用”的探索,仍旧处于一个非常表面的阶段。
她进一步表示,目前,大家看到数字人更多想到的是如何去做品牌的营销、如何用数字人制作宣传视频,“我认为这是大家开始认知数字人第一个想到的应用,但是我并不认为这是真正数字人(应用场景)。”仅仅把数字人的应用停留在宣传片层面,栾青认为,这是对数字人的技术的巨大浪费。
在她看来,数字人最终是真正的生产力,“因为人本身就是生产力,如果我们在任何一个场景下替代了人,它就是一个明确的生产力。”栾青认为,如今数字人行业已经走入一个更冷静、更务实的阶段,未来,行业也会从生产力的角度上,去思考和使数字人,把数字人变成一个普遍的方向。
小冰:AI Being普及化的加速
小冰公司打造的虚拟歌手陈水若/受访者供图
2023年开年,广东卫视春节晚会上有了虚拟歌手的身影,小冰打造的虚拟歌手陈水若,与钟镇涛、炎明熹等共同演绎了粤语贺年曲《财神到》。
陈水若基于小冰的神经网络渲染技术(XNR)生成,这种技术能生成一张此前完全不存在的脸(即AI创造面容),并根据表达内容的不同,渲染出不同的表情和动作。整体效果流畅、自然,与真实人类无异。
小冰公司首席执行官李笛在接受《每日经济新闻》记者采访时表示,过去一年,在抖音平台,小冰AI歌手的视频播放量达到5亿次,收到了1677.5万次的交互,回应了726.3万次的交互,交互量超过抖音99%的账号,“人工智能的高并发在这里得到了充分的体现。”
回顾去年,李笛表示,2022年,公司在虚拟人布局方面进一步拓展到了高度多样性的虚拟人,他们中绝大部分已经不再叫“小冰”,每个月,这些虚拟人服务的用户超过了1.6亿人次,“应该说我们正在不断的实践AI Being普及化的进程。”
李笛进一步介绍,除了在以往的 companion(伴侣)、assistant(助理)之外,小冰进一步拓展了更多面向企业的数字员工,以及在游戏中的AI Being的实际落地。2022年,小冰公司宣布成立ICEGamer游戏工作室并推动NPC向有情感的人工智能交互主体方向发展,由AI being担纲全部NPC。
而在整个行业的技术突破层面,李笛认为,2022年在人工智能或者说AI Being的几个核心技术栈上,整个行业取得了一些天花板级的突破。比如,大语言模型带来的对话能力的提升,以ChatGPT为代表;多模态的大模型带来的AIGC的提升;神经网络渲染带来的视觉方面的提升;一系列的超级自然语音技术带来的语音、情感融合在一起的这种交互能力的提升。“整个产业以前受限的技术瓶颈被打破了,所以它必然会迎来一个更快的创新发展。”
与此同时,小冰也面临着在人工智能方面的最主要难点,即技术创新和伦理以及社会接受度之间的距离。人工智能最重要的一个特点是高并发,所以有一点点错误,都会被无限放大。李笛进一步举例称,一个能够写作或提供知识的人工智能系统,假设它的错误率是10%,假设每天有1亿次交互,那就意味着每天会创作超过一千万篇虚假新闻。人工智能的高并发会把错误率变得非常恐怖。“这方面一直是我们所面临的难点,就是说我们需要不停的反复审视我们手上的技术,设想这些技术落地时可能发生的挑战,以及我们自己怎样解决这些问题。”
谈及未来,李笛认为,人类社会在AI技术的推动下,必然会走向人人被AI Being环绕的那一天。“不只是每个人有一个虚拟人,而是每个人会和很多个虚拟人建立连接,每个虚拟人也可能会和很多个人建立连接,这将是一种全新的社交关系网。”
他进一步表示,虚拟人不存在从b端转向c端。“在我们的认识中,凡是需要AI Being这种带有一定拟人特点的人工智能系统,都意味着它必然是在跟人做交互,只要是跟人做交互,就需要有拟人特点。所以即便是给b端提供的AI Being,也非常鲜明的具有c端特点。”
基于此,李笛认为,对于人工智能AI Being来讲,所有的to b问题,归根结底都是to c问题,从b端转向c端,实际上早已发生。
每经科技:媒体+技术的数字人解法
雨燕智宣智慧微课系统/受访者供图
没有特别打扮,通过手机录了一段30秒的视频,等待了半小时后,周宇翔看到了自己的虚拟人形象,那是每经科技团队首次成功自主做出虚拟人。“我真人在电脑面前,然后看着电脑里边的自己,那一刻其实也是非常激动非常惊喜。”周宇翔说。
由这次的突破展开,2022年12月9日,每日经济新闻正式推出了由子公司每经新视界科技有限公司(以下简称每经科技)自主研发的视频生产全流程AI智能解决方案——“雨燕智宣”。
每经科技自主研发数字人技术,融合了语音识别、语音合成、图像识别、自然语言处理、语音驱动数字人等AI核心技术,支持根据真人形象进行定制和训练,对人物的骨骼、衣服、表情、身体动作等进行具体设计,以达到真实、自然、形象、生动的效果,通过录入的文本、语音驱动数字人的播报,数字人的唇形、动作、表情等通过模型计算渲染生产基于真人视频进行学习和训练,成品数字人还原度高,有效降低维和感。
每经科技产品经理周宇翔表示,2022年对每经科技而言是一个技术大年。2021年每日经济新闻与小冰公司合作,上线了每经AI电视,依托N小黑、N小白两位虚拟主播,进行24小时新闻播报。以此为契机,每经科技开始了对自研虚拟人的摸索,并在2022年成功掌握了虚拟人自主建模和训练的能力。
2022年在虚拟人领域的技术突破以及与自身媒体业务相匹配的应用场景,是周宇翔认为每经科技在2022年最大的成果之一。
周宇翔认为,探索虚拟人,不仅是在媒体的业务场景中植入一个虚拟人形象,还能够通过对虚拟人以及AI技术为代表的新兴技术的探索,为媒体转型提供技术思路和技术空间。他举了个例子,受限于电视端等硬件条件,以往,纸媒要做类似于电视类的传播媒介,是不可想象的,“每经在转型的过程中,其中一项重点是尽可能将各类传播媒介进行融合应用,来达到传播效果的最佳程度,而虚拟人技术的诞生以及其在虚拟主播等领域的延伸应用,为包括纸媒在内的非电视端媒介提供了一个非常好的融合的机会。”
目前,每经科技推出的雨燕智宣平台已经形成了自己的系列成品矩阵,其虚拟人除了未来可应用于每经AI电视以外,还可通过AI短视频生成平台、智慧微课平台等系统应用到资讯短视频、投教类长视频、品宣推广视频等制作环节中,利用新兴技术的高效来大幅减轻甚至替代以往人工需要反复介入的工作。“虚拟人的技术本身只是一个单纯的技术,而和各行各业应用场景结合,创造出更多价值,是虚拟人技术衍生出来后最大的意义所在。”
周宇翔表示,未来每经科技也将继续探索与更多实际业务、应用场景相结合,“当前虚拟人技术的价值核心表面上看是含‘科’量的提升,但归根结底依旧在于解放人力资源,提高生产力。如果不能挖掘或者融入实际的应用场景,其实对于市场来说没有任何价值。怎么样让虚拟人从好看向好用转化,这是我们做切入的重点方向。”