深度报道

元宇宙技术发展动向(1):生成式人工智能续写元宇宙新篇章

包括元宇宙在内的未来产业,是抢抓新一轮科技革命和产业变革的重要机遇,实现引领发展的重要抓手。2021年以来,元宇宙成为备受青睐的互联网产业新风口,并在内容生产、场景构建、虚实界面、认证机制等创新技术的驱动下不断演进。

编者按:包括元宇宙在内的未来产业,是抢抓新一轮科技革命和产业变革的重要机遇,实现引领发展的重要抓手。2021年以来,元宇宙成为备受青睐的互联网产业新风口,并在内容生产、场景构建、虚实界面、认证机制等创新技术的驱动下不断演进。中国电子报推出元宇宙技术发展动向系列报道,采访权威专家学者和龙头企业,分析关键技术对元宇宙发展引发的边际性变化,敬请关注。

备受追捧的元宇宙在爆火之后似乎进入了一段阵痛期。尤其是最近一段时间,NFT“退潮”、虚拟地产“哑火”、大厂元宇宙团队解散等相关消息的传出,更是让不少人对元宇宙的后续发展存疑。与之形成鲜明对比的是以大模型为代表的AIGC(生成式人工智能)技术浪潮席卷全球,话题热度持续不落。这让不少人发出疑问:元宇宙“过气”了吗?AIGC与元宇宙之间究竟是“此消彼长”还是“相辅相成”?接下来,还会不会有新故事出现?多位业内专家认为,二者之间并非竞争关系,相反,AIGC正在为元宇宙续写新篇章。

1000 (21)

AIGC开启“全民创作”新时代

要建造一个元宇宙,首先需要包括各种各样的虚拟场景、物体、角色、事件等在内的大量的数字内容来填充。此前,内容匮乏被认为是元宇宙落地所面临的核心挑战之一。然而,AIGC的走红颠覆了这一局面。

AIGC即AI Generated Content,指的是利用人工智能技术来生成各种形式的数字内容,比如图像、音频、视频、文本、3D模型等。它被认为是继PGC、UGC之后的新型内容创作方式。像近期流行的“动漫脸”“AI作画”“数字人”“聊天机器人”等背后都离不开AIGC技术的支撑。

百度CEO李彦宏公开表示,未来10年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。

不同于人类创作者,AIGC利用人工智能模型来学习已有数据的模式和结构,并根据输入条件来生成新的内容。这让其可以不受人类创作者的数量和能力的限制,不受时间、成本、技能、灵感等因素的影响,快速、稳定地生成大量高质量的内容,从而大幅提升生产效率。

同时,AIGC还可以根据用户需求和偏好来为其定制个性化的内容,更好地满足元宇宙空间里人们对内容差异化和定制化的需求。比如,在社交元宇宙空间Horizon Worlds中,用户不需要具备任何设计或编程的技能,只需输入自己想要的发型、服装、外貌等特征,就能通过AIGC技术自动生成独一无二的虚拟化形象。

此外,AIGC还可以利用人工智能模型来实现内容和用户之间的智能对话和生成,增强用户参与度和内容互动性,进一步优化元宇宙的沉浸式体验。像英伟达推出的GET3D,让用户通过输入文字或语音,就可以生成一个3D场景,并且可以在其中进行自由的互动。

专业AIGC工具不仅可以提高创作者的生产力,还显著降低了将创意变为现实的技术门槛。在前不久召开的2023游戏开发者大会上,Epic、Roblox等纷纷推出了利用AIGC技术打造元宇宙空间的相关工具。

最近风头正盛的OpenAI也在推进AIGC生成3D内容。元宇宙建设工具的AI化,使创作正在成为用户进入元宇宙的吸引力。

1000 (22)

8K 3D VR元宇宙直播间

Forrester分析师卢冠男分析称:“AIGC会对现有的内容制作流程有更显著的贡献,提高内容生产效率,以及降低内容创作门槛,甚至将创作环节平民化。AIGC支持下的内容创作方式会成为解决元宇宙内容匮乏问题的重要工具之一。”

不过,他同时也指出,目前还很难说AIGC是解决元宇宙内容问题的最优解,因为很多企业仍在探索客户对元宇宙场景的内容需求,哪些内容需求可通过AIGC相关工具或流程满足,仍然不确定。

打开元宇宙技术的想象空间

从技术维度来看,此轮AIGC的爆发主要得益于算法技术取得的进展,其中包含对抗网络、流生成模型、扩散模型等深度学习算法。各类算法功能分别覆盖了数据权重的选择、从噪声中构建数据样本、不同语言文本翻译、图像文字特征值匹配等。这些技术与元宇宙的底层核心技术一脉相承。

“要实现元宇宙这样一个庞大而复杂的虚拟世界,需要多种前沿技术的支持,而且是一个长期渐进的过程。要想在元宇宙获得接近真实的体验,仅有人类玩家是远远不够的,还需要有无限多的虚拟场景、智能化的NPC、故事引擎等,这些依赖AIGC才能办到。”阿里元境副总经理、技术负责人郭旷野说道。他认为,其实从ChatGPT、大模型技术开始,就达到了一个质变的情况。

在搜集元宇宙最新进展时,记者了解到,Meta于5月16日最新开源的多感官AI模型ImageBind已经能够以视觉为核心,结合文本、声音、深度、热量(红外辐射)、运动(惯性传感器),最终做到6个模态之间任意地理解和转换。

Meta方面表示,ImageBind只需要很少的训练就可以应用于各种不同模态和任务。如果与其他AI结合,还可以做到跨模态的生成。比如听到“狗叫”画出一只狗,同时给出对应的深度图和文字描述。甚至还能做到不同模态之间的运算,如“鸟的图像+海浪的声音”,得到“鸟在海边的图像”。

ImageBind所展示出的未来人工智能生成多感官感知的可能性,为设计和体验身临其境的虚拟世界打开了大门,这意味着人们离想象中的元宇宙世界更近了一步。

“AIGC技术突破给元宇宙发展带来了更多助力,”上海维享时空创始人范晓表示,“以空间计算和空间AIGC为根基的元宇宙,可以打破物理空间的唯一和单调,赋予空间更大的想象力和增量价值。我们可以将模型打磨得更接近真实系统,让曾经只存在于互联网上的数字化体验出现在线下实景。”

谈及技术路线,卢冠男分析称,从近期发展来看,先是由Diffusion 为主的模型为基础,改善了文字生成图片的质量,从而引发了行业对AIGC的关注;接着由于OpenAI发布ChatGPT,证明了GPT模型和RLHF可以显著提高会话过程中,语义理解和文本生产能力。无论是Diffusion还是GPT模型都属于大模型或基础模型,其也是深度学习算法之一。

相较于上一代模型,当前主流的AIGC模型尺寸也有显著增加。

“对元宇宙而言,新的AI技术可以改善现有场景甚至创造新的场景。和其他技术领域一样,AIGC 或者生成式人工智能技术将会对现有各个技术领域产生显著影响。”卢冠男说道。

1000 (23)

中央广播电视台VR三维影像绘制技术展示区

AIGC赋能元宇宙的故事仍在继续

实际上,关于元宇宙的争议一直存在。近日,科技和商业公关公司的CEO Ed Zitron公开表示,Metaverse(元宇宙)已经消亡并被企业界抛弃,投资者早已转向当下火热的人工智能。游戏制作公司Epic Games CEO Tim Sweeney则用“6亿月活”这一数字还击了Ed Zitron的说法。此前,“元宇宙第一股”Roblox在最新发布的2023年第一季度财报披露,其日活跃用户量再度破新高,同比增长22%至6600万。

根据赛迪研究院最新发布的《元宇宙产业链生态发展白皮书(2023年)》显示,到2025年中国将形成近万亿元的元宇宙产业规模。在新技术基础设施方面,以ChatGPT为代表的生成式人工智能(AIGC)成为当下及未来AI发展的重要趋势。

从全球市场来看,市场调研公司Research and Markets报告显示,元宇宙市场预计在预测期内(2022—2030年)年复合增长率将达到40%,到2030年市场收入将达到7000亿美元。国际咨询公司Analysis Group表示,从2022年起,元宇宙将对世界经济产生巨大贡献;到2031年的未来十年对全球GDP的贡献可达到3万亿美元。

对于元宇宙的未来,英伟达Omniverse副总裁Lebaredian表示看好。他表示,预计在十年后或更早,市场上有望诞生只需通过人机交流即可创建高质量3D内容的成熟模型。人工智能技术的进步,将为构建可定制的虚拟世界提供越来越多丰富的细节及相应的操作选项。届时,数万亿市场估值的AIGC将更好支撑元宇宙赛道,带动上下游产业链协同创新,为元宇宙发展不断注入活力。

不过就现阶段而言,挑战依然存在。卢冠男指出,第一,对于现有的AIGC服务而言,如何降低成本,提高响应速度是进一步扩大其影响范围的关键;第二,行业对AIGC的使用场景仍在探索阶段,企业仍需投入一定资源,探索如何将现有产品与AIGC融合;第三,生成式人工智能技术发展已经开始围绕图片生成、文本生成、代码生成等更加细分的任务开始优化,并在这一过程中,探索商业化模式,但现在还很难预测大规模商业化的时间点。

他建议,从行业角度来看,监管机构需对生成式内容服务权责进行进一步明确和细化。平台侧或服务提供方需要提供工具识别或改善AIGC的生成结果。提供方也需结合自身使用规范,对平台用户加以引导。企业与个人使用方面,也需要主动关注合规,并避免潜在版权风险。

根据技术成熟度曲线,每一项新技术的出现,都将经历诞生期、泡沫期、低谷期、复苏期、成熟期五大阶段。元宇宙的诞生并非昙花一现,而是新一代信息技术发展带来的创新与变革,是人们对数字生活的美好想象与期待。作为未来内容生成的主力,AIGC将为元宇宙的“先破后立”续写全新的篇章。

24快报
JSON抓取失败