7月8日,2023世界人工智能大会(下称“WAIC 2023”)在上海世博中心闭幕。作为史上参与人数最多的一届WAIC,此次展会迎来超400家企业参展,大模型、生成式AI、机器人、智能驾驶等成为大会热门关键词。
如果说2022年被称为生成式人工智能之年,2023年则把大模型推向了一个高峰。以GPT-4的发布为标志,生成式人工智能,朝着通用人工智能的方向,进入了创新应用的阶段。
“语言大模型(LLM)主导的生成式AI,毫无疑问将是未来几年最重要的生产力工具,不但突破以前AI应用无法突破的极限,而且将重塑各行各业,并深刻改变企业的各个产业环节,未来已至,只是还没有均匀分布。”星环科技CEO孙元浩接受《证券日报》记者采访时指出。
闪马智能董事长彭垚在接受《证券日报》记者采访时表示:“大模型对内容生成和机器人两个领域影响最大。现在我们用大模型对图片进行描述、翻译、识别,国内外很多企业在做。但是视频大模型非常难,首先来说怎么让机器去训练,其次数据这块本身就是一个非常大的投入,市面上开源的大模型已经有几十亿被英文标注过了,过程中再如何去定义中文的描述,也很重要。”
AIGC产业发展初见成效 虚拟人经济效应凸显
在7月8日的AIGC专场分论坛上,上海市徐汇区委常委、副区长俞林伟表示,AIGC所带来的产业发展已经初见成效。其中在专有模型层面,AIGC独角兽特赞科技通过开发了营销内容和图像创作场景的专有模型,助力企业和创作者实现内容管理、积累、生产、分析的需求,将为徐汇人工智能产业的发展注入新的活力。
同济大学设计人工智能实验室主任范凌在会上表示,AIGC与产业结合主要体现在三个方面,第一,生成式人工智能会赋能更多产业的想象力;第二,在生成式人工智能技术的初期,需要更多“先行而后知”的创建者精神;第三,技术发展的最终目的还是服务于人,人机协作应让人的工作更快乐、更幸福,而非让人成为“工具人”。
对于AIGC发展最好的方向,彭垚对记者表示:“短期来讲,内容生成现在最大的赋能是机器人和视频两个产业,像视频这方面成熟的场景它还是属于内容生成,现在已经有虚拟人这种非常成熟的应用,抖音上后面的大量的短视频都是AIGC的,已经在应用落地层面大大提高了效率。”
此次人工智能大会,一些成熟的AIGC应用先后亮相,网易、华为、商汤等大厂纷纷带来了AIGC相关应用产品,体验区不少参展者纷纷排长队体验。
魔珐科技携三款自研AIGC消费级超写实虚拟人产品亮相,分别为“有光”虚拟直播,“有灵”交互虚拟人和“有言”AIGC虚拟人视频生成。据悉,魔珐“有言”AIGC虚拟人视频生成是一款有效赋能企业零门槛生成超写实虚拟人视频,解决企业日常虚拟人视频制作难点的AIGC提效工具。结合魔珐的AIGC三维动画和语音技术,这款产品一键生成各类主题虚拟人视频,可以应用于产品发布、公关播报、员工培训、节日庆祝等各种场景。
“我们的虚拟人产品根据精度不同售价在10-100万元不等,可以定制,基于魔珐自研的AI表演动画技术,包括动作、表情、眼神和手指动作的高精度捕捉技术,动作重定向和表情迁移技术,可以实现高精准度,高自由度的虚拟直播。”
此外,网易伏羲旗下一款名为丹青约的AI产品在WAIC2023主场及各大分会场均设置了体验区。工作人员对《证券日报》记者介绍称:“网易伏羲这款AI产品以中文语义大模型为基础,有海量的图片库,AI生成的图片均有版权。丹青约与midjourney功能类似,不一样的地方在于后者的版权没法得到保护,且语义是英文的。
中鼎研究院研究员蔡晓龙对《证券日报》记者表示:“AIGC目前应用方向很多,聊天机器人、对话搜索、文生图、文生文、个性化音频创作、给虚拟人注入灵魂,提升机器人规划控制能力等。目前,最热门的应该是聊天机器人,AIGC也是因为ChatGPT火出圈的。”
新的商业模式将不断出现 千亿美元平台型企业将诞生
对于AIGC的发展趋势,蔡晓龙对记者表示,“AIGC发展趋势是非常明确的,正在快速落地应用场景,持续提升产品智能水平。以文本创造图片来说,目前整体的使用效果还是比较一般,给人的感觉就是不够智能,从国内某厂商公开测试的版本来看,很多时候生成的图片不能满足要求,元素比较单一,也不支持多关键字或多重对话修改,不能满足AIGC工具功能需求。
“生成式AI大模型想运用到各个领域通常需要结合各个领域的专用知识和场景技能的适配,有一点像从通才到专才的过程,这个可以用Layernorm技术进行参数学习。在文本创作和代码生成领域,AI已经成为提高效率的重要工具。”Unity中国CEO张俊波对《证券日报》记者表示。
当前,市面上一些发展成熟的垂类大模型成为细分领域公司AIGC发力的方向。众安保险总经理姜兴对《证券日报》记者表示,垂直领域大模型有望成为企业AIGC发力的方向。其中,金融保险行业因其高价值、高可得性和高丰富度的数据沉淀,可能成为AIGC应用发展的天然土壤。
作为决定AIGC效果的关键,其底层大模型的迭代发展也成为应用落地的关键。
“大模型走到视频阶段是综合性技术结合的结果,到现在为止,视频的动态过程的表达都没有一家公司能很好解决。再者,视频内容最难的是它的数据没办法一步标清楚。因为视频本身就是时间序的空间描述,技术上要把2D描述转化成3D逻辑,比研发机器人难多了。”彭垚对记者分析道。
对于未来生成式AI未来的投资机会,启明创投内部人士对《证券日报》记者表示:“3年内,颠覆式的AI应用的核心驱动力来自底层模型的创新,两者无法解耦,模型的作用将大于产品设计的作用。当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台性企业的机会。”
“从投资方向来看,如果未来文生图、文生文的功能效果极佳,将极大降低专业化创作的门槛,带来丰富多样的内容生态,可能会因此诞生新的内容平台或新的商业模式。作为工具的大模型或垂直领域模型也会获得很好的发展空间,有很好的投资价值。如果虚拟人在AI的加持下变得有血有肉,那么可能会在陪护或教育领域有非常不错的应用前景,各种具有想象空间的应用会很多,对应的都会带来一些产业红利机会。”蔡晓龙对记者补充称。