拓尔思信息技术股份有限公司ChatGPT概念股拓尔思的优先目标市场是元宇宙、新闻出版等。2月21日晚间,拓尔思信息技术股份有限公司(拓尔思,300229.SZ)披露投资者关系活动记录表称,公司将加快推进“智创”(一款专注文字生成类的内容自动生产平台)AIGC(AI Generated Content,即利用人工智能技术来生成内容)平台的研发。
公告显示,拓尔思副总经理、董事会秘书李党生接待机构调研时透露,公司将加快推进“智创”AIGC平台的研发,该平台依托公司长期积累的自然语言处理技术和人工智能平台产品为基础,融合开源大模型,将专注在辅助型、应用型、创作型等文本内容的自动生成研发。
拓尔思表示,公司将优先关注新闻出版、政务服务、金融领域、通用行业、元宇宙和云服务等AIGC细分市场,从降本增效走向额外价值转移。
拓尔思是国内最早从事自然语言处理(NLP)研发的企业之一,主营业务包括人工智能产品及服务、大数据产品及服务和数据安全产品及服务等。
据拓尔思介绍,基于NLP技术的文本生成可以算作是AIGC中发展最早的一部分技术。2016年,拓尔思在浙江日报报业集团的融媒体智能传播服务平台中(以下简称“媒立方”),率先推出了机器写作,主要根据拓尔思的全网资讯大数据自动生成体育、气象和财经等领域的主题稿件,推送到浙报媒立方。
谈及公司在AIGC领域的发展规划,拓尔思表示,公司将基于通用AIGC大模型,专注优势行业进行专业大模型的研发,融合学习行业特有的大数据和知识,提升大模型对行业应用的适配性。公司也将以预训练大模型、In-Context Learning、instruction tuning等技术为基础,将公司自主研发的文本生成、交互式生成、跨模态生成、小样本学习、大模型与外部知识库的融合等功能作为研发重点,突破基于大模型的AIGC关键技术,在问答式AI、智能创作、搜索引擎等领域实现成功应用。
在数据要素领域,拓尔思表示,目前,公司基于深度学习的自训练模型和专业知识域,打造了面向产业、媒体资讯、网络舆情三大领域的数据资产平台,不仅可以面向内部数星风控、海策政策大脑、冒烟指数、天目开源情报等云和数据服务产品进行数据赋能,也可为政府、媒体、金融、企业、安全等行业用户提供云和数据服务。
拓尔思推出的搜索型数据库“海贝”颇受机构关注。据拓尔思介绍,百度和360属于互联网搜索引擎,公司的TRS海贝搜索数据库(以下简称“海贝”)属于企业级搜索引擎,面向企业或政府部门,常见的应用场景包括站内搜索、企业搜索、智能问答、数据分析、数据库加速、运维监控等。
据拓尔思称,海贝是一款从内核到系统完全国产自研的搜索型数据库,融入了自研的NLP技术,如文本分词、自动分类、相似文本检索、拼音检索提示等,也集成了深度学习引擎,支持以文搜图、以图搜图、图文融合搜索,可以对图像中的文字进行OCR识别,也可以提取图像或者文本的特征数据,通过基因编码存储到海贝数据库里,成功实现图像相似性检索功能。
记录表显示,目前,海贝已经服务于安全大数据、媒体大数据、政府大数据以及军队大数据等众多细分行业,拥有公安部、新华社、国家市场监督管理总局、海关总署、专利局、商标局等一系列客户。在国家层面,几个重大的基础数据库,例如云搜系统、企业信用信息公示系统、专利检索系统等都构建在海贝之上。
拓尔思认为,目前,国内搜索引擎数据库市场是美国上市公司开源软件ElasticSearch一家独大,且开源软件数据泄露、涉及国家信息安全的事件频出。拓尔思表示,信创潮下,搜索型数据库坚持自主研发是国产替代的必由之路。
据该公司透露,目前海贝已完成与龙芯、海光、飞腾、鲲鹏等国产芯片以及中标麒麟、统信UOS等国产操作系统的适配工作,完全满足信创要求和国产化替换需求。
以信用中国项目为例,该项目由国家发展改革委、人民银行指导,国家信息中心主办。原来在某云平台上由ElasticSearch对外提供检索服务,2018年迁移至公司“TRS海贝大数据管理系统”上,目前海贝在该项目中每秒需要支持大约1.2万的并发检索,日访问量接近10亿,获得了用户的高度认可。
据拓尔思2022年第三季度报告,去年前三季度,该公司实现营业收入约6.37亿元,同比(较上年同期)增长4.95%;归属于上市公司股东的净利润约为1.04亿元,同比增长约4.49%。
在半年报中,拓尔思披露,公司人工智能、大数据软件产品和服务合计营业收入占比达72%,其中人工智能软件产品和服务收入本期增长较快,较上年同期同比增长88.99%,包括安全产品在内的自主研发的技术产品和服务合计收入占比超过85%,且毛利率均超过70%,具有较高的盈利能力,其余主要为系统集成和其他收入。
截至2月21日,拓尔思(300229.SZ)收跌8.02%,报收21.80元,今年以来股价已累计涨逾86%。