去年末,openai公司基于其gpt-4大模型开发的聊天工具chatgpt横空出世,点燃了当下这股人工智能热潮的第一把火。此后,一系列基于人工智能大模型的应用,让大众逐渐意识到,如今的人工智能已不再仅仅只是苹果手机里的siri,或是智能家电里的语音助手,而是已经在一定程度上,接近科幻片里的那种人工智能了——似乎真的拥有智能、似乎真的会思考、似乎真的有可能在未来取代人类。
作为全球科技巨头,微软和谷歌当然不愿被openai这个后生晚辈抢去风头,在今年初相继公布了自家成果。与此同时,人工智能大模型在国内商业领域亦被迅速认定为“风口”。随之而来的,是互联网大厂、科研院所乃至明星投资人的竞相入局。尽管其中部分项目刚刚起步,有些甚至还停留在纸面,但是一场被媒体戏称为“百模大战”的混战已经吹响了号角。
大战过后,能否“卷”出属于中国人的chatgpt?抑或最终只是徒留一地鸡毛?结局犹未可知。热潮之中、风口之下,仍需一些冷思考。
5月6日,科大讯飞正式发布旗下的人工智能认知大模型“星火”,“百模大战”又添一位强力玩家。在此之前,包括百度、阿里、腾讯、华为等在内的大厂,今年均已先后公布了各自的大模型及相关产品。
作为国内人工智能领域领军企业,总部位于安徽合肥的科大讯飞推出自研人工智能大模型,可谓意料之中。此番发布“星火”,科大讯飞显然寄予厚望,意欲对标chatgpt。在当日的发布会上,公司董事长刘庆峰表示要向openai致敬和学习,同时也要快速追赶并努力超越。
刘庆峰还公布了年内“星火”技术升级的三个明确时间节点,chatgpt再度成为其参照系。根据科大讯飞方面的时间表,今年6月9日,“星火”将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升;10月24日,将实现通用模型对标chatgpt,中文超越chatgpt的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
树大招风。不只科大讯飞,chatgpt几乎是所有“百模大战”参与者共同的目标和假想敌。今年3月,李开复在宣布其筹组的名为project ai 2.0的新项目时,更是豪言“不仅仅要做中文版chatgpt”。
事实上,做“中文版chatgpt”或许并没有想象中困难。科技行业普遍将人工智能大模型视作一种软件技术,其核心是近年来逐渐被我们所熟悉的概念:算法。建立于海量数据基础之上的chatgpt,已经展示了算法的力量。背靠同样体量巨大的中文互联网数据以及国内企业在应用层面积累的经验,人工智能大模型的门槛并不高。沿着这一技术路径继续前进,“中文版chatgpt”的诞生理论上只是时间早晚的问题。
眼下的“百模大战”中,在实际应用落地层面的“战果”显示度最高。新近参战的科大讯飞,在发布“星火”大模型的同时,亦发布了教育、办公、汽车、数字员工四大行业应用成果,并宣布首批来自36个行业的3000余家企业开发者将接入“星火”大模型。
而就在科大讯飞发布会的前一天,网易有道发布了一段基于“子曰”大模型研发的ai口语老师的视频,视频中的ai“雅思考官”可以主动用英语与用户进行对话。同日,学而思也公布了自研数学大模型mathgpt。该模型面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,将于年内推出基于该自研大模型的产品级应用。
人工智能大模型赛道的火热,不免让人联想起始于两年前的“元宇宙”风潮。以facebook创始人马克·扎克伯格将公司更名为meta(即元宇宙metaverse的前缀)为标志,同样一度席卷全球的“元宇宙”在经历了太多的虚无缥缈、太多的概念先行、太多的夸夸其谈后,时至今日仍未有多少实际成果,更多的只是新瓶旧酒与概念炒作。
乃至扎克伯格对于“元宇宙”的热捧,亦被不少观察者解读为facebook在互联网广告业务受挫、增长放缓的情况下,扎向自己胸口的一针强心剂。正是基于此,我们不愿意看到“百模大战”最终演变为一群急功近利的玩家为了短期利益,通过炒作概念而引发的闹剧。
相比之下,眼下这波人工智能大模型的热潮,确实为绝大多数的普通人带来了更多实打实的东西:无论是能够和你聊得有来有回的chatgpt,还是可以根据文字描述就能“创作”出画面的midjourney,都能让人切实感受到人工智能的力量。同时,也让人工智能大模型成了一个可供把玩的玩具。
在最初的惊叹与猎奇过后,越来越多的普通用户正开始尝试利用人工智能大模型生产内容。近来在b站刷屏的“ai孙燕姿”便是一例:通过开源的人工智能语音合成软件,用户只需简单的操作,就可以让孙燕姿“唱”周杰伦的歌,甚至让郭德纲“唱”日语“二次元”歌曲。这背后,是用户通过不断地“投喂”数据,对人工智能大模型进行训练的成果。
然而,开源人工智能大模型依靠用户“投喂”进行学习,从而不断“成长”的特点,也让“百模大战”参与者通过“套壳”与“换皮”来投机取巧在事实上成为可能。部分企业片面强调应用、对核心技术语焉不详的表现,也在一定程度上证明了这样的担忧并非全无根据。
低门槛、高显示度、高感知度,人工智能大模型的确不失为一个理想的“风口”。人工智能大模型在国内丰富的应用场景的确值得期待,但是模型算法等核心技术上的创新显然更具含金量。套用国产科幻电影《流浪地球2》中角色的台词:没有核心能力创新的创新,毫无意义。