人工智能的革命是否已经到来?
关键词:
人工智能、数字人、替代、市场
2022 年一年虚拟主播(数字人)企业注册增加数就高达 948 家,IDC在《中国AI数字人市场现状与机会分析,2022》报告中预计,到2026年中国AI数字人市场规模将达到102.4亿元。很快,数字人的百亿市场就要到来。
试问,数字人背后有哪些核心技术升级?数字人是如何走入产业的?以及数字人的商业进程是否一定会一帆风顺?带着这些问题,咱们走入文章。
近期大热的ChatGPT聊天机器人已经向人们展示了,AI不但能根据人们的要求进行丰富的内容创造,而且还可以和人们产生长时间、多轮次、有逻辑的文字互动。ChatGPT不仅可以回答人们的问题,还可以进行情感分析、自然语言处理、语音合成等多种应用。与传统的问答机器人相比,ChatGPT聊天机器人已经可以通过人工智能模型进行模拟人类对话。
现阶段,ChatGPT聊天机器人多数以文字的形式与人们产生交互。但是,有些数字人厂商正在试图将数字人与ChatGPT聊天机器人相结合,以产生更加丰富的交互体验。数字人是一种虚拟形象,通过计算机图像技术和人工智能技术,可以产生出高度逼真的虚拟人物。数字人的使用场景非常广泛,包括社交娱乐、在线客服、虚拟主播等等。
设想一下,如果将数字人和ChatGPT聊天机器人相结合,那么将会产生一个无限向人类思维靠近的数字人,数字人和现实人类之间的界限将被模糊。人们将无法准确判断,究竟是屏幕之后的数字人,还是素未谋面的网友。
对于数字人厂商来说,将数字人与ChatGPT聊天机器人相结合是一个很有商机的市场。不少数字人厂商已经开始积极行动,试图将数字人接入ChatGPT。这样一来,数字人就可以通过ChatGPT聊天机器人来实现与人类的互动,进一步提升用户体验和满足市场需求。
过去,无论是担任电影主角的数字人还是能唱会跳的虚拟偶像,他们的诞生都需要依赖价格高昂的光学动捕设备。数字人制作成本高、制作时间长、拍摄技术门槛高,成为限制数字人走入生活的三道"枷锁"。
为了松绑这三道"枷锁",产业玩家们一直在做出努力,其中快速发展的AI技术成为斩断数字人产业"枷锁"的锋利武器之一。如今,AI技术已经广泛应用于数字人的数字资产生成、内容生产以及人机交互等环节。
根据国际调研机构IDC的称述,AI数字人技术提供商市场格局可简单分为2-3个梯队,其中第一梯队以百度智能云、商汤、小冰公司为主。百度智能云的曦灵数字人平台在技术能力、工程化能力和安全保障能力三个维度上获得了认证,成为中国信通院云计算与大数据研究所等机构联合认证的首批数字人厂商。并在信通院的第二轮分级评测中,凭借高分获得了行业唯一的"杰出级"证书,代表了当前中国数字人的最高水平。
为了让虚拟数字人更具生动性,百度采用了4D Learning技术、Smart IK智能身体绑定调适系统等三大技术。通过4D扫描技术精准还原面部肌肉动作,并结合深度学习自研的AI语音驱动算法和4D Learning技术,使逐字口型合成的准确率超过98.5%。同时,借助Smart IK智能身体绑定调适系统,数字人的每个关节的肢体驱动和肌肉抗压与真人相似,进一步提升了数字人的生动性。
落地金融、文旅等场景,数字人正向产业深处发展。
百度智能云曦灵平台打造的虚拟数字人刘三姐在抖音上唱完山歌后,送上了自己的新春祝福,成为百度在文旅领域落地的典型案例之一。在创造刘三姐的形象时,百度团队参考了历代刘三姐的扮演者形象,结合广西当地女性的外貌特征,进行了多种不同风格的外形设计。同时,在服装上,百度结合刘三姐的风格设计,打造了兼顾壮族民族特色和现代元素的服装。作为广西文旅的数字符号之一,刘三姐经常出现在各类大会现场,并通过小程序和游客互动,介绍当地美食特色等信息。
百度还为浦发等众多银行打造了多种类型的"数字员工",构建大规模的数字员工队伍,提供包含产品解读、市场资讯、财富诊断、产品推荐等多样化服务。其中,数字人小浦可以对近万款基金产品、多款财富产品的盈利、风险特点进行详细剖析和解读,并根据客户持仓情况和风险承受程度,给予资产配置的调整建议。根据客户不同的财务目标和管理需求,个性化推荐理财及基金产品。数字人自带的渠道流量优势也大幅提升了服务的效率。
数字人主播在直播领域也取得了显著的成效。使用数字人主播可以节省成本,月薪2万的真人主播,换成数字人主播,一年就能节省十万的成本。数字人主播无需休息,甚至可以连续24小时不间断直播。财经作家吴晓波在跨年演讲中表示,每家公司都可能需要一个数字人,在本地生活、客服、品牌直播、短视频等方面使用数字人。
2023年,数字人技术成本大幅下降,从过去的几十万元降至几千元,这使得中小商家也能够负担得起数字人直播,因此数字人直播的数量在今年以来显著增加。根据艾媒咨询的数据,目前数字人主播可以分为三类:媒体型、娱乐型和电商型。媒体型虚拟主播主要面向新闻媒体,取代真人主持,主要播放资讯类内容;娱乐型主播以B站上活跃的大量虚拟UP主为代表,通常以二次元画风的"皮肤"为主要特征;而电商型主播则更接近真人主播的形象。用户对数字人的接受度也在不断提高,根据艾媒咨询的调研结果显示,未来将有36.7%的受访者表示对虚拟主播的消费意愿将增加。
数字人直播具有两大优势。
首先是节省成本。
使用数字人直播主要可以节省人力成本。根据@Tech星球的报道,一位采用数字人直播的企业负责人提到:"数字人主要是省人力成本,一个主播平均月薪两万元,一年也要240万元。一个AI主播的定制费用为8000元,一年的系统使用费为8万元多,可以省下来10多万元。如果有20位主播,一年就可以节省200万元"。
其次是能够有效利用闲时流量。
许多商家和企业目前采用真人和数字人结合的直播形式。在黄金时间段由真人主持直播,因为真人直播更具人情味,也能更及时地回答直播间内的问题,整体上直播间的氛围更好。而在真人主播下播后,数字人主播开始上场,填补了商家和企业无真人主播直播时的时间空档,吸引更多真人主播难以覆盖到的用户。
然而,数字人直播也存在四个劣势。
首先是同步问题。当企业刚选择使用数字人技术时,成本相对较高,一个中小企业参与数字人直播可能需要投入一二十万元的费用,而且这还不包括后续的运营成本。此外,由于数字人对硬件设备的要求较高,操作设备的成本也较高。即使投入了大量成本,仍然容易遇到一些问题,例如数字人的卡顿、无法实现真实效果的在线回答以及声音驱动脚本与图像不同步的现象。
第二个劣势是情感拟人化问题。虽然数字人直播中的台词在某种程度上类似于官方发言人,但与真人主播相比,它们的讲话并不像真人那样口语化和亲近。
第三个劣势是互动问题。当直播间的观众人数较多时,数字人在互动和回答问题方面可能不及真人主播那样灵活机智。
最后一个劣势是平台封禁问题。由于各大平台更倾向于真人主播,因此有时会对虚拟主播进行封禁措施。
总的来说,虽然数字人直播在成本节省和利用闲时流量方面具有优势,但仍面临同步问题、情感拟人化问题、互动问题和平台封禁问题等多个劣势。这些问题需要进一步的技术改进和平台支持来提升数字人直播的质量和用户体验。
根据《虚拟现实与行业应用融合发展行动计划(2022-2026)》,中国工业和信息化部、教育部、文化和旅游部、国家广播电视总局以及国家体育总局等五个部门联合发布了该计划,将虚拟现实和增强现实列为数字经济的重点产业之一,并计划在2026年之前实现三维化、虚实融合沉浸影音关键技术的重大突破,以推动虚拟现实在重要经济和社会领域的规模应用,并丰富新一代适人化虚拟现实终端产品,完善相关产业生态。
当前市场上,虚拟数字人主要以2D数字人和少量真人驱动的3D数字人形式存在,主要应用于服务和文娱领域,如虚拟客服、虚拟主播等。然而,真正意义上的虚拟数字人是指具有智能、感知和交互能力的虚拟角色,目前还存在一些待攻克的技术难题。
随着未来算力的指数级增长,虚拟数字人产品需要具备实时三维重建能力、个性化交互能力和提供情感内容价值能力等特征。应用场景大致可能出现在以下四类:
服务类:在不同行业中(金融前台、销售客服等)辅助固定的、简单的、无需复杂操作的场景
知识传授类:在教育领域中扮演辅导老师一责
情感陪伴类:需要聊天时的情感慰藉
新场景类:结合AR眼镜的实时导游、导购
我现在唯一想到的一个机会是,现阶段各平台对短视频与中视频的激励很足,但拍视频相对来讲较消耗时间,且产出不确定。
那么数字人加AIGC可以很好地辅助文案产出与交互性的视频产出,获得平台激励的同时,节省了大量时间。
但如果后续这个方式逐渐普及,那么真人出镜还是会变成唯一出路,除非数字人发展到难辨真假、且说话腔调更接近真实人。