产业

大模型“涌现”下的商业机遇:“百模大战”谁能胜出

生成式AI技术正在改变人工智能行业,时隔仅半年,国内大模型发展已完成从技术到产品、再到商业的阶段跨越,并深入垂直行业领域。

生成式AI技术正在改变人工智能行业,时隔仅半年,国内大模型发展已完成从技术到产品、再到商业的阶段跨越,并深入垂直行业领域。7月6日世界人工智能大会期间,澎湃科技邀请北森人才管理研究院副院长王丹君、中金公司研究部副总经理于钟海、中关村科金技术副总裁张杰做客元宇宙聊天室,共同探讨大模型“涌现”下的商业创新机遇。本场对话由澎湃科技记者邵文主持,在一个小时的对话中,嘉宾们讨论了多个相关问题,包括:

通用大模型和垂直领域大模型在未来的商业场景中如何找到自身的价值?

企业如何抓住大模型的商业机遇?抓住机遇的关键点是什么?

……

大模型的前世与未来

澎湃科技:眼下国内市场已经形成了“百模大战”的局面,各位觉得国内大模型为何发展如此之快?对各位所在领域都有什么样的影响?

王丹君(北森人才管理研究院副院长):从技术的角度来讲,大模型的发展并不是最近这一两年的事情。很多年前在学术领域,大家已经开始做研究。只是这几年伴随数据量的增加,技术水平的提高,尤其是在OpenAI发布了ChatGPT以后,引发了广泛的关注。

对于各个领域来讲,大家思考的都是怎么把这样一个新技术,运用到自己的领域,如何去改善自己的商业模式。

比如说,我们北森人才管理研究院属于人力资源行业,服务的客户都是企业的HR(人力资源)群体。我们觉得大模型在人力资源领域的应用,未来可能产生一些颠覆性的价值,譬如它确实能够更好地提高大家的工作效率;它会在一定程度上帮助我们的伙伴,不管是HR还是员工更好地掌握工作技能;它能够更好地指引员工的发展;同时,也能帮助企业回答很多人力资源管理上的问题,包括我们在招聘员工时经常问的:谁更适合、谁可能带来更好的绩效、薪酬应该如何确定等。我觉得大模型的发展与应用会在非常短的时间改造人力资源行业。

于钟海(中金公司研究部副总经理):王院长讲到了非常重要的一点,就是大模型技术并不是今天才发生的。2017年,谷歌写了一篇很有名的论文,叫Attention Is All You Need(注意力就是你所需要的一切),提出了transformer架构。

其实中国人工智能产业的践行者很早就发现了大模型技术的潜力。我们在2021年也撰写了相关的研究报告,当时已被人工智能大模型的发展所震撼。现在ChatGPT这个具体的产品让老百姓都知道了大模型,不管你懂不懂技术,只要玩一下,就能感受到它的魅力,所以大模型火了。

大模型能够这么快的被千行百业应用起来也依赖于技术平权,这是我们提出的一个很重要的概念。得益于开源社区的发展,知识的自然传播,使得很多企业都快速做出了自己的大模型。

另外我想补充的是,这次我们看到整个科技圈乃至全社会形成了一股合力,即“所有的人都认为这事非常重要”,这是以往很少见到的。

张杰(中关村科金技术副总裁):我觉得大模型元年可以追溯到2020年GPT3推出的时候。为什么过去这半年发展如此之快?我认为是三方面的原因:

第一方面是有一些企业、高校之前就有很多积累,比如百度、华为、清华大学等,他们之前就有预训练语言模型或者大模型,最近半年对他们来说就是版本的更新迭代;

第二方面是各个企业包括一些投资机构加大了投资力度;

第三方面是依赖于开源,开源社区带动了企业推出各种各样的领域大模型。

关于大模型对所在领域的影响,对客户和我们来说是双向利好。中关村科金作为一家领先的对话式AI技术解决方案提供商,大模型降低了我们定制化开发各种场景模型的成本,这对我们来说是利好消息。对我们客户而言,智能化项目成本降低,使得很多中小企业也开始考虑立项,整个市场规模变大了。

澎湃科技:最近腾讯云、OpenAI都先后提出定制化模型软件的大模型商店,有点类似于app store的这种形式,各位如何理解这个趋势?

王丹君:不管是投资者,还是这个领域的实践者,相信大家都期望看到这个趋势,因为它促使更多人参与到这个领域的共创上来。我们认为,对于基础服务厂商来讲,未来一段时间肯定会趋向商店模式,这样更容易贴近客户。大模型商店的模式也使得接受服务的用户能更好地利用大模型去创造一些新的应用场景和服务价值。

于钟海:这其实是资本市场非常关注的一个问题。我会认为大模型的发展将来更像中国的公有云和私有云。

公有云其实当时叫IaaS(Infrastructure-as-a-Service,基础设施即服务),到了大模型这,我们叫MaaS(Model as a Service模型即服务)。海外有一个很知名的企业叫Hugging Face(抱抱脸),它就是把很多模型放在网上,你只要调用他的API(Application Program Interface,应用程序接口)就能使用不同的AI模型。

但也有很多企业,由于安全合规、细分场景落地等要求,需要部署自己的大模型,并用自己的知识给它增强做自己的Fine Tune(微调),这可能会像中国的私有云市场一样。

广义上来说,大模型其实是不适合大家直接去使用的,包括ChatGPT,它其实也是在大模型的基础上包装成一个产品,让每个老百姓都能体验。所以基于大模型去做应用,实际上是一个非常广阔的市场,它能衍生出很多商业模式,比如说数字员工,再比如刚刚主持人提到的这个app store的概念。

其实ChatGPT也被很多人认为是一个流量入口,据我所知有一些大模型手机厂商也可能会下场去做搜索,那这件事情就截然不同了,它的可及市场就会从企业的IT支出变成营销支出。中国企业可能在IT上的支出平均为收入的1%-3%,但可能会花30%的收入在营销上。因此当你有了流量后,商业模式可以发生非常大的变化,这是非常有意思的地方。

张杰:我觉得OpenAI和腾讯云是有不同侧重的。OpenAI的侧重点可能仍在于基础大模型,它通过一些生态合作伙伴,帮它在一些碎片化的场景里边补足基础大模型的准确度或者专业度上的不足。而腾讯云并没有过分强调自己的基础大模型,而是强调要做垂类行业的大模型。

他们不同的侧重点显示出一个共同问题,即基础大模型在一些专业性很高的具体行业或场景里是不能直接拿来用的,它还需要一个适配层。我觉得这里可能会有一个新的商业模式,就是未来越来越多的知识是可以资产化的。原来大家用AI的时候,技术范式是不一样的。所以大家能够共用的资产就是一些原始的数据,拿到原始数据以后,用不同的技术手段去加工,在这个过程中数据的中间形态是没办法交易的。

但是大模型把很多AI的任务基本上都统一到一起了,整个研究范式和处理流程趋同,这使得很多中间环节的产物可以交易,比如标注后的数据、做指令对齐的数据、提示词、以及提示词组所组成的提示链等,甚至是具体场景下训练出来的机器人或者助手等,都可以去做一些交易,被资产化,这可能是未来新的商业模式。

通用大模型VS垂直领域大模型

澎湃科技:刚刚其实三位都提到领域大模型和通用大模型这两种不同的商业路径,能不能具体谈一谈这两个不同的商业模式下的机遇和挑战。

王丹君:将来围绕大模型的商业一定会变成一个商业生态,商业生态里面核心的特征就是会分层。首先会有一些厂商来提供基础的服务,因为大模型需要数据的基础,需要算力。大模型作为底层引擎服务,虽然本身能力很强,但是它并不了解特定领域的知识和服务模式以及客户需求。

随之而来的是垂直领域的大模型。这些垂直领域的大模型,有一些是领域厂商自有大模型,有一些是基于基础大模型训练出来的。通俗地讲,就是让这些模型变成一个专家。比如说金融领域可能有专门去帮助投资者去做商业决策的一些服务,像人力资源领域,可能有专门帮企业去做人才决策的服务。

这其中可能还有很多细分的领域。这些细分领域可能同样也需要行业积累,需要训练,需要了解到底通过什么样的方式去解决客户的问题,甚至涉足到交互界面的用户体验层次。这些累积起来其实都是前面我们谈到的app store背后的一些能力。

于钟海:在我们来看,其实这两类市场还真的挺不一样的。

首先说通用大模型,构建一个好的数据飞轮也很重要。

举个例子,今天我教你打乒乓球,我说你应该这么打。然后我发一个球,你没有接住,你就知道这么打不对。那再换一个方式,这次你接住了,你就记住了对的方法。那我不断给你发球,你不断去接,一点点地调试你的肌肉记忆,找到最好的方法。其实模型的训练也是这样一个过程。你每次跟ChatGPT交流的时候,它底下会有一个点赞或者点踩。或者有的时候你什么也没说,只是非常失望重新生成了一个。或者比如每次用Midjourney画画的时候,它都会出现四个图像,然后你默认选了第三个,把它放大了,下载了,它就知道这张好像是更好的,以后会往这个方向稍微再偏一点,模型一点点就学会了。没有数据反馈的话,模型就停留在这里无法进步。所以这就是我们强调的数据飞轮,强调场景的卡位。作为一个通用大模型,其实最重要的是有人用,这也是中国的一个优势。中国的老百姓喜欢拥抱科技,对大模型的接受度也更好。我们有很多人去提供反馈。

对于领域大模型,我认为更重要的是know-how(从事某行业或者做某项工作,所需要的技术诀窍和专业知识)。

领域大模型关键是要迎合客户的需求,理解客户在某一个深度领域里面的know-how。像中关村科金这样的企业,他们的优势就在这里,他们在具体的领域场景里面理解客户的know-how,理解客户的痛点。

张杰:感谢于总的认可。我理解通用大模型和领域大模型是一个上下游的关系,不是一个竞争的关系。通用大模型讲究大而全,领域大模型是一个小而美的生意。

通用大模型的特点是“三高”,即投资高,回报高,但是不确定性也很高。因为训练一个基础的大模型,在算法、数据、人才方面要求都很高。比如算力,起码要有万卡天级别的算力。

为什么不确定性很高呢?因为入围的厂商基本都是互联网的大厂或者是科技大佬,要使训练出来的大模型具备通用能力和涌现能力,对技术要求非常高,如果想要在市场上立足,最起码要能够跑赢开源大模型,才有存活下来的可能。未来市场上,我觉得基础大模型会多家并存,但是可能也不会太多。

领域大模型可能就是一个小而美的赛道。训练一个领域大模型对算力要求并不是很高,据我们的实验,只需要单周就能够做到领域大模型的迭代。两张卡就可以实时做一些推理。然后在数据方面还是要建立起一些自己的门槛,也就是刚才于总讲的数据飞轮效应,这就要八仙过海,各显其能了。

最重要的一个竞争点就是人才。领域大模型把整个产业的技术链压扁了,你的人才既要懂算法,还要懂得怎么把算法很好地工程化,还要懂场景、懂业务,甚至还要懂产品的设计。需要激发人才的复合能力,然后激发人才的主动性、创造性,非常考验组织能力。

大模型在哪个领域最有用武之地?

澎湃科技:三位最看好的垂直领域应用方向是什么?

于钟海:我们看了很多方向,现在最看好的方向是AI Answer,这我们自己造的一个词,它指的是一类产品。比如今天你考我一个事情,你问我说婴儿车买哪个品牌更好。我相信各位应该也都有类似的情况,找三个朋友问一问,看五篇小红书,然后再去网上搜十个帖子。最后看完以后,总结出来三个型号,然后再看看价格,做出决定。

其实很多事情你问人工智能也是这样,大模型是有一定的记忆的,它知道这些东西之间相关,但它会产生幻觉,就像人一样,也会搞混,记不住到底谁长成什么样子。所以企业里经常做的事情就是基于内部的知识库做一定的查询,然后基于这些东西做一个总结。另外还有基于一个文档,比如基于好几百页的一篇保险条款做一个问答、总结或者对比。或者基于搜索给一个答案。这类产品我们都统称为AI Answer。另外我们也比较关注比如办公、AI学习机等机会。

张杰:我觉得可以先分行业看,再分场景看。领域大模型理想的行业是知识密度高、流程逻辑性强、安全隐私性敏感的行业,比如说像金融、医疗、法律、政务这些行业可能是未来领域大模型落地比较理想的行业。

场景可能最开始的时候是先面向内部员工赋能的。比如做一些知识问答,然后是培训、陪练。内部员工赋能之后,再看怎么去to c(对客户)做一些服务,或者是赋能销售人员、客服人员,做成营销客服助手。总之应用的时候可以先考虑从容错性比较高的场景入手。

王丹君:我们也认为现在大家的应用经验里,大模型帮我们解决最多问题的还是在知识密集型行业。像北森或者中关村科金所在的To B领域,确实会有一些企业从中更容易受益。比如说在企业的人力资源管理里面,大家希望能够让大模型去解决一些对人来说很枯燥、很无聊的事情,如回答员工的各种共同关注的问题。北森和中关村科金也在探讨这方面的合作,希望将来通过大模型这种底层设施建立一些数字员工,回答这些似乎不是特别需要人类的经验和知识性的问题。

另外我们发现还有一些高价值的领域,比如企业的领导力教练。一家企业有多个层级的管理者,每个管理者每天都会遇到各种各样的挑战,但是他没有那么多机会去请教别人,我们认为在这个场景下AIGC可以提供非常好的帮助,并且能够很好满足个人对于私密性的一些要求。

澎湃科技:最近微软宣布与OpenAI合作打通应用生态,中关村科金作为国内的大模型应用厂商代表,目前产品落地应用进展如何?未来是否每家企业都会拥有自己的专属模型?

张杰:我觉得并不是每个企业都需要自己的专属模型,因为大模型技术我觉得可以由浅至深分成三层:

第一层,如果行业或者企业,没有那么多的知识或文档,或者企业本身的特殊性不强,就没必要用一个专属的模型,直接用通用大模型就可以。在通用大模型之上,针对具体的场景需求,去调prompt(提示语)就可以了。在这期间企业需要的是一个用户体验良好的、低门槛的提示词管理工具。可能需要一些业务专家在特定场景底下积累一些好用的提示词;复杂一点的需要把一些提示词变成一个小的提示集合,然后不同的集合之间再串成链条,链条之间有先后的逻辑关系,有一个提示链的管理工具就够了。

第二层就复杂一点。有些企业碎片性知识比较多,这时候提示词或者提示链可能不够,就需要在通用大模型之上,再外挂一个知识库,用于管理低频长尾的知识。通用大模型面对具体问题的时候去知识库里面找答案。这是通用大模型+知识库+提示工程的技术路线。

第三层,对于领域常识总量大的企业,需要构建企业专属的领域大模型,将领域里的通识输入到大模型的脑子里,既保持通用的常识和推理,又具备领域内的专业知识和技能,让大模型由文科生变成领域专家。这是一种领域大模型+领域知识库+提示工程的路线。

中关村科金针对上述三种情况都有一些应用落地实践,我们前段时间一直在尝试解决三个技术难点,解决后形成了两套助手类的应用。这三个技术难点是什么呢?

第一个就是解决大模型经常出现幻觉的问题,即一本正经地胡说八道。这就需要有一个领域的知识库,让大模型知道,被问到什么问题时,要去知识库里找相关的知识。构建知识库的时候,往往需要处理富文本格式的文档,需要让大模型先理解文档布局,再理解里边的内容。

第二个就是训练领域大模型的时候,要防止训练过程中的遗忘问题。否则你往它脑子里输送新知识的时候,它会忘记老的知识。这里会用到高效微调的技术手段,让它既具备原来的通识,又能够学到领域内的常识。

第三个就是怎么能让用户更方便且低成本地使用它。无论是领域大模型、还是领域知识库、还是提示词,都不是一蹴而就的,都需要持续反馈迭代,这就要让客户自己具备维护能力,工具层面要做好产品设计和工程化封装。

澎湃科技:想问问于总从投资的角度看,相对于移动互联网和硬科技时代的投资逻辑,在这一轮大模型热潮中,对于选择项目的核心关注点,包括投资的决策点是什么?

于钟海:这个也是资本一直在探寻的问题。过去大半年,大模型的行情也经历了很多轮的演变。刚开始,很多人把它当作一个主题投资,那时炒的是跟AI相关的公司,很受大家重视的是真正有大模型底层能力的公司。后来出现“百模大战”,大家觉得大模型好像有点太卷了,发现算力好像是掘金场买铲的受益者,所以算力相关的企业估值又涨了很多。到今年五六月份的时候,我们提出了“AI应用迎来了爆发的寒武纪”。很多企业都拿出了自己的产品,AI的应用又开始涨。

其实大模型的投资节奏也是渐变的,从一开始只要是AI公司就可以涨,到后面要拿出应用,再到大家开始探索这个应用有没有客户为它买单,有没有真正的订单。我觉得可能再过一年左右的时间,大家就会去思考这个应用到底有没有壁垒,商业是不是长期可持续的。我们其实最看好的是应用层面,我们很重视真正能在大模型和企业应用之间实现连接的企业,他们能真正创造价值。

澎湃科技:下一个问题是问王院长,从人才的角度,现在大模型正在构建一种人机协同的新型生产关系。那么这对企业的人才管理会产生什么样的影响?

王丹君:这是一个特别好的问题。因为我们看到在社会层面,可能大家非常热衷于讨论“我的工作将来会不会被大模型取代?”对于这个问题,我建议可以从两方面来看:

一方面大家讨论比较多的是大模型能力越来越强,垂直领域的应用也越来越深入,将来可能会替代很多一般性员工的工作。这几年即使没有大模型发展的背景下,大家都非常关注降本增效,就涉及企业里人力成本占比。如果能够通过一些新技术去降低人力成本,对企业很有价值,这是它可持续发展的一个很重要原因。

另一方面,大模型的出现,以及未来更多的垂直领域的工具出现,对于员工来讲,是能力的加持。从积极层面来看,如果员工能够更好地利用人机协作,可以给公司创造更多的价值。

我们预测未来的组织形态会有一些变化。现在绝大部分的公司是职能型架构,不同的职能去服务同样的客户,职能之间有很多协作、沟通的问题,对公司来讲是极大的消耗。但是未来当员工个体或者群体,具备了在工具帮助下全方位的能力,这个组织的单元势必会更小,它能更敏捷、更灵活、更快速响应。

澎湃科技:我想问三位在百模大战的时代背景下,企业最需要具备什么样的能力?

张杰:对于基础大模型厂商而言,他们最需要的就是具备特别强的、独到的技术能力,要跑赢开源大模型,然后在多模态或者复杂推理上有一些技术的独特性。对于领域大模型厂商,最需要的就是复合型人才,而且组织能力非常重要。因为要发挥人才的主动性、创造性,把一些前沿的商机对接给他,让他知道客户需要什么。此外,还要有一些工程性的能力和算法性的能力。

于钟海:我认为数据蛮重要的,特别是对想用大模型的企业来讲,数据真的很重要。其实数据很快就会成为我们的一个壁垒,就像中关村科金这样的提供大模型应用的企业,他们很大的优势就在于数据。

王丹君:其实对于绝大部分的企业来讲,将来比较大的可能性都是大模型的消费者,而不是大模型的创造者,积极拥抱大模型可能会极大加速其数字化管理的进程。组织和个体可能都需要去拥抱变化,各个层级的领导者需要增强拥抱这种新机会的意识,员工需要保持持续、自驱的学习能力。

澎湃科技:在这个过程中,垂直领域企业拥有了行业know-how的优势。他们是不是更容易突破大模型数据的卡点?

张杰:我觉得行业know-how要具体来看,可能有几种形态要特别关注。

行业know-how最显而易见的一种形态就是存在文档里边的一些数据,这些都是符号性的表达。怎么从文档里边挖掘出来prompt(提示词)或者提示链,这是当前阶段就需要去处理的一类问题。很多企业里面有大量的文档,而且这些文档里面很多是PPT或PDF的格式。既需要读懂它的格式,又要读懂里面的内容。

除了这类行业的know-how以外,还有就是隐藏在行业专家或者场景专家脑子里的知识,需要给他一个工具,总结成prompt词,prompt模板是密度更高的行业know-how。

还有一类比较隐性的行业know-how就是藏在系统日志里的集体智慧。这些日志经过挖掘,能够把比较零散的知识变成结构化的链条的知识。然后再从千千万万的链条里边,归纳总结变成一个特定场景底下的最佳实践。比如销售人员每天会打很多电话,每天能够积攒下来对话的日志有几百万通,按照成单、流单或者挂电话等不同结果做一些裁剪,就能够沉淀出来营销新产品话术的最佳实践。

这三类问题,其实都是特别好的行业know-how。这里边也有一些技术挑战,比如怎么从文档里、日志里挖掘出提示词,挖掘出提示链条。doc2prompt和log2prompt是值得投入研究的重点。

于钟海:其实张杰总有一句话我印象很深,他说把太阳系八大行星几千几百万年的运转轨道都记录下来,都不如抽象出来一条万有引力定律更能解释事情的本质。

我觉得这就是know-how。垂直领域的公司在相关的领域里有很多经验,我举一个例子,大家在人工智能火了之后都说有一个新的年薪百万的职业叫prompt engineer,

就是去写prompt的工程师。那为什么他们这么值钱呢?我自己也使用人工智能绘画的工具。有一次我想要画一个穿西装的人,我试了很多关键词都不好使。后来我输入 “领带”,这个人马上就穿上了西装,你会发现这才是那个magic word。

大模型有一点像概率游戏,它其实是有很多先验的概率。在刚刚那个场景里,领带就是西装对应的那个非常重要的词。而prompt engineer知道哪些关键词能扰动这个模型,他知道我们到底想写出什么样的东西来,这个就是他的价值。那如果我们把这件事情放在做应用的场景里面,它其实就是垂直领域公司的价值。既懂人工智能,他又懂行业的know-how。

王丹君:目前看起来除了基础大模型公司,垂直领域公司是第二批市场上大家会很关注的企业。我觉得在接下来的一段时间,对他们也是非常有挑战的。垂直领域公司的经验不一定能够直接转化成新技术加持下的新创造力。需要先要花更多的时间去学习,去理解大模型运作的底层逻辑是什么,去学习它如何能够帮助我,甚至是去帮助我挖掘我们的知识,或者帮助我们给客户提供服务。我认为未来一段时间,他们首先面临的是这个挑战。在这些基础上,基于这些模式找到给客户创造价值的新的机会点。

澎湃科技:最近有一些新的动向,例如ChatGPT访问人数的增速在放缓。它其实没有成为一个超级入口这样的存在。有观点认为ChatGPT不能代表GPT的未来,只是OpenAI和微软拿出来向市场展示的一个产品。三位怎么看这个观点?

于钟海:这个观点确实蛮有趣的。我个人相对乐观一点,因为我是一个经常使用大模型产品的人。而且我想补充一点,现在的ChatGPT不是它的最终形态。我认为谷歌下一代安卓系统里的google assistant(谷歌助手)会由自己的大模型来支持,因为这也是一个非常重要的流量入口。

王丹君:对很多行业人士来讲,大家都很乐观。它作为一个新的产品,发展到这个阶段,自然会有一些分化。对于终端用户来讲,会对这样的工具感兴趣,愿意去尝试,并持续使用。哪怕使用的频次在降低,关注度在降低,但是用户的行为是很难改变的。

张杰:我觉得ChatGPT增速放缓是早晚要发生的一件事,毕竟流量是有天花板的。早晚有一天流量要见顶或者大众对闲聊的应用场景会热情减退,闲聊毕竟不是高频刚需,但是它给大家带来一个特别好的启发。

一方面,围绕着Chat会有很多种应用,例如通过聊天生成图片、视频、报表、PPT等,如ChatDoc、ChatPdf、ChatBI。另外一个场景,就是刚才所说的领域大模型,比如金融GPT、法律GPT、医疗GPT,这些将来可能都会是一些新的商业入口。

24快报
JSON抓取失败