近期,国内多家科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。
9月初,科大讯飞宣布讯飞星火认知大模型面向全民开放服务,至此,首批包括讯飞星火、百度文心一言、商汤SenseChat等在内共十余款人工智能大模型全部面向公众开放服务。另外包括腾讯在内的一些公司的大模型也通过备案,将择机面向公众开放。
人工智能大模型是指使用大规模数据和强大的计算能力训练出来的“大参数”模型,这些模型通常具有高度的通用性和泛化能力,可以应用于自然语言处理、图像识别、语音识别等领域。
此前我国多家企业和机构已经发布了大模型产品并进行了小范围内测,此次开放服务的大模型也意味着它们通过了相关部门备案。8月15日,我国正式实施《生成式人工智能服务管理暂行办法》。
目前,多家公司正探索大模型在各行业的深度应用。9月初,腾讯混元大模型正式对外亮相并宣布通过腾讯云对外开放API接入服务。腾讯公司相关负责人介绍,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部业务和产品,已经接入混元大模型并取得初步效果,更多业务和应用正在逐步接入中。
百度公司科技与社会研究中心主任余欢介绍,文心一言自今年3月面世至今快速成长,熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。效率方面,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。
据悉,vivo自研大模型获得了权威大模型评测榜单C-Eval和CMMLU榜单第一,其AI能力已超GPT。
但,业内人士认为,当前国内大模型研发虽然进展迅速,但算力、人才等瓶颈仍待进一步突破,商业模式也还需进一步明晰。