企业

星星之火,可以燎原——科大讯飞

作为中国最大的智能语音技术提供商,科大讯飞在人工智能领域的研究和应用进展迅速,同时也暴露出诸多问题,成为这个时代极具代表性的企业。

短短半年,人工智能产业席卷全球,以ChatGPT为代表的大语言模型取得了重大进展,在应用领域俨然成为新一轮变革的核心动力,为产业的跨越式发展提供可能。因此,几乎所有科技企业鱼贯而入。

作为中国最大的智能语音技术提供商,科大讯飞在人工智能领域的研究和应用进展迅速,同时也暴露出诸多问题,成为这个时代极具代表性的企业。

“ALL IN” AI

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事智能语音、自然语言理解、计算机视觉等核心技术研究,促进人工智能产品和行业应用落地,致力让机器“能听会说,能理解会思考,用人工智能建设美好世界”。

2008年,科大讯飞在深圳证券交易所挂牌上市(股票代码:002230),截至目前公司总市值达到1146亿元。

凭借着丰富的技术创新与产品,科大讯飞在历年内获得了诸多荣誉,其中两次荣获“国家科技进步奖”及中国信息产业自主创新荣誉“信息产业重大技术发明奖”,被任命为中文语音交互技术标准工作组组长单位,牵头制定中文语音技术标准。

除此之外,细数公司发展历程,人工智能业务一直贯穿其中。

- 2010年,科大讯飞在业界发布以智能语音和人机交互为核心的人工智能开放平台“讯飞开放平台”,为开发者提供一站式人工智能解决方案。

- 2014年,科大讯飞正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统。

- 2017年,科大讯飞成为首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心。

- 2019年,科大讯飞新一代语音翻译关键技术及系统获得世界人工智能大会最高荣誉SAIL(Super AI Leader,即“卓越人工智能引领者奖”)应用奖。

- 2021年,科大讯飞获中国智能科技最高奖“吴文俊人工智能科技进步奖”一等奖。

终于,在2022年12月,科大讯飞启动“1+N”大模型技术攻关: “1”指通用认知大模型算法研发及高效训练方案底座平台; “N”指将认知大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。

进入2023年,科大讯飞也终于推出重磅产品“星火”。

星星之火,可以燎原

2023年5月6日,科大讯飞正式发布“星火认知大模型”。

发布会现场,科大讯飞董事长刘庆峰介绍,科大讯飞与认知智能国家重点实验室牵头设计通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨,最终形成了覆盖7大类、481个细分任务类型。

星火认知大模型拥有七大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。

- 多模交互:可上传图片素材,实现多模理解;围绕上传图片素材,响应用户完成回答;根据用户描述,生成符合期望的合成音频和视频;整合AI虚拟人,快速生成匹配视频。

- 代码生成:智能生成单行或函数级代码建议,根据注释、函数名自动生成代码;支持逐行代码注释,学习海量范式,快速精准解读;精准定位拼写、语法、逻辑错误,支持新老代码比较和一键修改;智能生成单元测试数据。

- 文本生成:根据用户要求,创作具有吸引力与情感共鸣的商业文案;创作多种形式的营销方案;使用英文完成多风格多任务的的长写作任务;创作严谨详实的新闻通稿等。

- 数学能力:求解一元二次方程、二元一次方程、三元一次方程等;解答平面几何和立体几何;处理导数、积分等微积分相关的问题,涉及基本概念如极限、连续性、导数等;涉及随机变量、概率分布、假设检验等方面的内容。

- 语言理解:翻译多种语言的文字,包括英语、中文、法语、德语、西班牙语等常用语种;根据文本提取简洁而准确的摘要,快速理解文章的核心观点;检查语法错误并提供正确的语法建议,使写作更加规范与专业;分析文本中的情感色彩,如正面、负面或中性,更好了解内容观点和态度。

- 知识问答:提供有关日常生活的知识,如饮食、运动、旅游等方面的建议;提供工作方面的知识,如沟通技巧、时间管理技巧、团队协作等方面的建议;提供基本的健康保健知识以及疾病预防、诊断和治疗方面的建议;提供有关历史事件、文化传承、名人故事、名言警句等方面的文案。

- 逻辑推理:通过分析问题的前提条件和假设来推理出答案或解决方案,给出新的想法和见解;使用已有的数据和信息进行推断、预测和验证等科学研究中的基本任务;在进行对话交流时,运用已有的常识知识来分析、解释和回应用户的提问或需求。

除此之外,发布会上讯飞董事长刘庆峰还介绍了搭载星火大模型的一系列应用,包括教育、办公、汽车、数字员工。具体用例有星火大模型赋能的讯飞AI学习机、讯飞智能办公本、讯飞智能座舱等。

6月9日,科大讯飞24周年庆上,讯飞星火认知大模型V1.5正式发布。星火大模型各项能力获得提升,并在综合能力上实现三大升级:开放式知识问答、多轮对话、逻辑推理和数学能力。同时,星火APP同步发布,面向生活、工作等用户高频使用场景上线200+小助手,用户创作中心还支持持续共创和分享。

8月15日,科大讯飞再次举行讯飞星火认知大模型V2.0升级发布会,董事长刘庆峰、研究院院长刘聪发布了代码能力和多模态能力的升级,同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品。

代码能力方面,星火针对最需要的5个维度进行了升级,包括代码生成、代码补齐、代码纠错、代码解释和单元测试生成。另外提供编程小助手,如iFlyCode1.0工具,可在10分钟内完成一个比较有经验的代码工程师一天才能完成的需求。

多模态能力方面,星火V2.0升级图像描述、理解推理、识图创作、文图生成以及虚拟人合成等能力,多模态能力升级后的产品讯飞智作2.0也正式亮相。

除此之外,搭载星火V2.0能力的星火语伴2.0、星火教师助手、讯飞AI学习机、讯飞翻译机也同步升级发布。

当然,最值得一提的是与华为联合发布的星火一体机。作为一款软硬件一体化的私有专属大模型解决方案,提供底层算力、AI框架、训练算法、推理能力、应用成效等全栈AI能力,帮助企业打造专属大模型。

经过数次迭代,星火大模型的功能逐渐完善,除七项核心能力外,大模型提供星火助手、星火插件、星火API。

星火助手可以创建拥有海量知识与专业能力的AI助手,比如PPT大纲助手、代码工程师、公文润色大师、市场分析师等等,超过10000个星火助手覆盖从职场、学习到生活的全场景。

星火插件新增文档问答、PPT生成、简历生成,针对具体需求进行针对性的服务。

星火API采用流式接口设计,首帧响应最快可达毫秒级。借助高效算法与架构,能在极短时间处理大量用户请求。并且可在多元场景持续进化,灵活应用,个性定制专属的模型解决方案。

科大讯飞董事长刘庆峰曾表示,10月24日,通用模型将对标ChatGPT(GPT3.5),中文能力实现超越ChatGPT,英文能力与ChatGPT相当。

星火下的隐忧

大势之下,科大讯飞“ALL IN” AI绝对是一个正确的选择,不仅能够发挥传统技术优势,还能赋能自家硬件产品,并提供行业解决方案为市场赋能。

但星火大模型之下,科大讯飞的经营困境重重。

2023年上半年,科大讯飞营业收入78.42亿元,同比下降2.26%;归属净利润7357.20万元,同比大跌73.54%;扣非净利润-3.04亿元,较上半年同期由盈转亏。

对此,科大讯飞在财报中表示,原因系公司应对美国极限施压,在核心技术自主可控和产业链可控等方面坚定投入的同时, 积极抢抓通用人工智能的历史新机遇,加大通用人工智能认知大模型的战略投入。

除此之外,科大讯飞的盈利能力也备受质疑。财报显示6月末,公司经营活动产生的现金流量净额为-15.29亿元,而资产负债率也达到历史最高的49.83%。

回看讯飞耗尽心力推出的星火大模型,到底未来能否扛起盈利的重担尚未可知。但从目前激烈的市场竞争格局来说,讯飞星火也并没有太多优势可言。

况且2023年上半年科大讯飞的研发费用仅有16.56亿元,同比增长3.57%。反而销售费用高达14.55亿元,同比增长6.13%。

勇往直前,笃定AI

即使如此,科大讯飞依然表现出对人工智能的执着。

财报中称,伴随着人工智能技术的持续突破,人工智能的规模化产业应用打开了全新的空间。科大讯飞认为AI将像水和电一样赋能千行百业,成为新一轮产业变革的核心驱动力,促进社会的进步与发展。并逐步从行业发展的补充,转变为产业数字化转型的核心竞争力。

并且科大讯飞认为基于大模型的人工智能技术将给多个行业带来重大模式创新和产业变革机遇。对于普通用户来说,也有望成为每个人的人工智能助手,提升每个人的工作效率和生活质量,深刻地改变人类的生产和生活方式。

我们的观点

半年时间,基于大模型的人工智能产品疯狂输出,在给企业行业带来机遇的同时,还有一个问题不容忽视,那就是投入到这条赛道的企业未来能否因此受益。

AI大模型的研发不仅需要算力、数据,也需要人才、资金,更需要在同质化的竞争中拥有自己的优势。一旦在这场竞争中败下阵来,损失也是巨大的。

科大讯飞选择了深耕AI+,选择了用人工智能建设美好世界。对于市场和用户来说,这自然值得肯定,但能否因此改善企业未来的生存状况还有待印证。

最后,新浪VR期待有更多优秀的企业和产品在AI的风口一飞冲天,也期待关心这一领域的你加入到与我们共同探索的道路中来。

关键词

相关阅读

24快报
伟时电子新增“元宇宙”概念
2024年11月22日 17:05
JSON抓取失败