产业

人工智能行业应用专题:Glow、Character.AI打开AI to C想象空间

从Glow到Character.AI,AI to C产品日渐成熟。 目前国内聊天机器人应用Glow,已经具备文本、音频的输出能力,凭借用户定义的性格、人设特征 ,提供情感陪伴的体验。

(报告出品方/作者:中信建投,杨艾莉,杨晓玮)

核心观点:

从Glow到Character.AI,AI to C产品日渐成熟。 目前国内聊天机器人应用Glow,已经具备文本、音频的输出能力,凭借用户定义的性格、人设特征 ,提供情感陪伴的体验。 海外类似应用Character.AI获得1.5亿美元融资、估值达10亿美元,具备生成和识别图像的能力,配 合更丰富的虚构人物、开放群聊功能、支持头脑风暴或计划制定等应用场景,让聊天机器人的体验 更加贴近真人互动,虚拟人的产品形态进一步成熟。

前言:AI升级交互体验,虚拟人和教育应用场景广阔

技术基础:AI走向多模态

多模态升级交互体验,实现“数字人”向“数智人”转变。单模态以情感陪伴聊天机器人Glow为 代表的“数字人”为例,其已经可以实现与真人的个性化、拟人化、智能化的聊天互动,但交互 方式仍局限在文本、语音。未来,随着多模态模型的发展,虚拟人或机器人的交互方式,有望拓 展至图片、音乐乃至视频,并以更贴近真人的逻辑、理解、表达能力进行交流和反馈,从而提升 虚拟人在电商、直播、教育、客服、社交、文旅导览等领域的互动体验。

AI模型与应用向多模态升级迭代。Vision Transformer模型、扩散模型、BEiT模型等技术的迭代 ,实现了传统单模态大模型中自然语言处理能力与计算机视觉能力的结合,以及大规模自监督预 训练,由此使得大模型具备了理解、处理和生成图片、音视频等多模态的能力,催生了Open AI GPT-4、谷歌PaLM-E、百度文心一言等多模态大模型。多模态模型也带动了多模态应用的诞生, 涉及代码生成、文本生成、图像生成、音视频、游戏、虚拟人等领域。

第一章:海外相关应用:AI聊天应用Glow、Character.AI及其他产业链公司

1.1.1、Glow:用户定义人设的AI情感陪伴聊天机器人

Glow为基于大模型的AI聊天应用,由国内人工智能创业公司MiniMax在22年11月推出,为用户提供 情感陪伴、满足虚构情景想象的体验。据甲子光年,Glow上线约4个月后,目前已有约500万用户。基于用户描述,生成个性化对话机器人。Glow的基本玩法是用户在应用中创建AI机器人“智能体” ,智能体将基于用户描述的性格、人设、头像及选定的音色等,与用户开展实时沟通、互动。也可 输入“参考名人” ,智能体将具备特定名人的有关知识储备。据体验,创建的“托尼斯塔克”智能 体有《复仇者联盟》系列的知识储备,具备较强代入感。

1.1.2、Glow:提供情感陪伴体验,辅助虚构情景联想

1)互动对象多元,提供差异化、多样化、个性化聊天体验。用户可与自己创建的个性化智能体进行 聊天互动,也可与平台内其他用户创建的智能体互动。用户可为其他用户创建的智能体补充专属设 定,让相关智能体符合用户个性化需求。据观察,平台内部分智能体已与近6万个用户进行互动。 2)互动方式当前仅为文字和语音。据体验,目前Glow内智能体暂时无法反馈图片内容,但从对话 内容来看,随着产品的改进,图片内容或在后续版本中引入。此外,用户也可以切换智能体的反馈 ,从而按照用户的偏好推进聊天。

3)互动话题多元,包含情感、虚构情景联想等。用户可以与智能体就任何话题内容进行聊天,可完 成情绪反馈、对话问答、简易信息搜寻等,也可以根据特定的话题,选择关联的智能体进行聊天, 例如情感、美食、虚构情景(如遭遇吸血鬼的场景)等。其中,平台官方智能体季枫和沈思前具备 剧情模式,通过主动引导用户对话,来推动剧情演绎并完成任务。 4)互动记录可公开,丰富可浏览内容。Glow拥有记忆簿功能,即用户可将智能体对话的部分内容 公开,供平台内其他用户浏览、评价,本质上是用户与AI共创内容,以丰富平台内的内容供给。

我们认为,相比于微信、探探、ChatGPT等聊天应用,Glow或在一定程度上更好地解决用户情感陪 伴以及奇幻情景联想的需求,从而增强用户的使用粘性。 情感陪伴方面:Glow的智能体可实时响应、性格多样,相比于工具属性较强的ChatGPT,能反馈个 性更加鲜明的回复,能一定程度上满足用户倾诉、寻求情绪反馈乃至猎奇的需求;且相比于微信、 探探等真人社交应用,用户使用Glow时,不必担心情感宣泄给对方造成的负担或对自身真实形象的 影响。 奇幻情景联想方面:据体验,Glow能一定程度满足用户对虚构人物、虚构场景的幻想。智能体设定 方面,可设定为历史名人、影视文学作品人物、动物乃至虚构生物;虚构场景方面,用户的话题可 设定在历代王朝、鬼屋乃至影视文学作品内等。基于真人社交的微信、探探等,这方面体验较少。

1.1.3、Glow的开发公司MiniMax:小而美的高科技公司,支持产品迭代、变现

Glow的技术支持由开发公司MiniMax提供 , 核 心 为 三 大 模 态 的 基 础 模 型 架 构 、 “User-in-the-Loop”的用户反馈机制以及 优秀技术人员配置。 1)掌握自研三大模态的基础模型架构。 MiniMax为北京稀宇科技有限公司,是2021 年成立的人工智能创业公司,通过直接从底 层模型切入,基于Transformer架构,自研 了文本到视觉、文本到语音、文本到文本三 大模态的基础模型架构,是国内较早同时拥 有3个模态大模型能力的创业公司。 模型开发投入相对可控。据技术合伙人杨斌 ,文本、语言、视觉三模态是几乎所有数字 内容的基础形态,只需一个较小的团队,来 共同维护优化三个大模型、做好用户闭环, 即可具备较好的内容生成能力。据甲子光年 ,MiniMax目前团队人数约100人。

2)用户反馈机制优化产品体验。Glow基于“User-in-the-Loop”进行产品输出结果的人为优化,即在 与智能体对话过程中,用户针对智能体的回答可给予“点赞”“差评”“有趣”“逻辑不通”的反 馈,模型将由此强化对用户对话喜好的认知,从而优化产品体验。 此机制与ChatGPT的基于人类反馈的强化学习机制类似(Reinforcement Learning from Human Feedback,RLHF)。即大语言模型(LLM)接收提示符并输出多个回答后,人类对其回答进行评 估与排序,在奖励模型(Reward Model)中按回答的质量高低赋予不同奖励,并将奖励结果反馈给 LLM,LLM据此进行强化学习,以优化下一轮结果输出。

3)公司核心技术成员多具备丰富产业或学术界经验。据甲子光年,MiniMax核心技术人员均来自全 球知名高校和全球知名科技公司,具备较丰富的自然语言处理、语音、计算机视觉、计算机图形学 等业界或学术界经验,近33%的成员拥有世界知名技术实验室博士学位,拥有上百个全球发明专利 。例如联合创始人闫俊杰为中科院自动化所博士,在深度学习和计算机视觉领域发表的论文被 Google Scholar引用超1万次,也曾在商汤负责搭建深度学习底层算法及人脸识别等技术体系。

1.2、Charater.AI:可与更丰富虚构人物对话,支持图片、音频多模态交互

与Glow类似, Charater.AI也是一款供C端消费者娱乐的AI聊天机器人,具备情感陪伴与设定虚构人 物的能力。Charater.AI允许用户以与Glow相近的方式,自行创建具有特定个性、人设和知识储备的 聊天机器人,例如世界名人、历史人物、文学影视虚构人物乃至动物,为用户提供新奇、强带入感 的聊天体验。相比Glow,Charater.AI也具备更丰富的虚构人物、可识别和生成图片、支持语音输入 、支持群聊等特色。

月访问量快速突破1亿,估值达10亿美元。Charater.AI由前谷歌员工于2021年在美国创立,两位创 始人均参与过谷歌大模型LaMDA的研发,其中一位也是Transformer论文作者之一。公司同名聊天机 器人于22年9月上线网页版,该网页月度访问量已突破1亿;公司近期也获得了知名风投 公司Andreessen Horowitz的1.5亿美元投资,估值达10亿美元。Andreessen Horowitz曾在早期投资 Airbnb、拼车应用Lyft、支付公司Stripe等知名科技公司。

相较于Glow,Charater.AI的特色主要在于,虚构人物的类型与应用场景更加丰富,并支持多模态 、多语言的能力,以及支持群聊,能为用户提供更接近真人的沟通体验。

1)虚构人物类型丰富:据我们统计,目前Character.AI共有68类虚构人物标签,如世界名人(如马 斯克、爱因斯坦)、游戏人物、虚拟主播、动漫人物、口语老师、哲学家、政治家等,相比于Glow 的三类标签(剧本、闲聊、情感),更加丰富,能更好的满足多元用户的多样话题交谈需求。 2)突出满足幻想以外的应用场景。Character.AI在主界面的“Featured”选项内,单独列示了在特 定领域经过充分训练的聊天机器人,能帮用户以对话方式快速获得相关体验,例如学习外语、头脑 风暴、旅行规划、推荐好书、帮忙做决定等,让用户在Character.AI的体验不局限于满足幻想或体 验新奇,适用于更多应用场景。我们认为,这背后对应Character.AI使用的训练数据集较Glow更 加丰富。

3)可在对话中生成与识别图片:Glow目前暂不支持在对话中使用图片。而对于Charater.AI,生成图 片方面,用户可在创建机器人时,单独为其开启图片生成的能力,机器人将在每次对话时,按照用 户要求的风格,配上与对话内容具备一定关联度的图片;识别图片方面,用户可上传或直接通过描 述生成图片,所有机器人都可就图片展开对话。据体验,图像生成能力有进一步优化空间。 4)支持输入音频。Glow目前为机器人的每条文字回复配上了语音,但用户无法发送语音; Character.AI则同时支持机器人输出与用户输入语音,平台内也有擅长口语矫正的机器人,可作为用 户的口语陪练。但据体验,语音输入功能存在无法使用的情况。

5)支持更多语种。Glow在中文语料上有充分训练,但对英语、日语等其他语种的理解有待提升;Character.AI则可以就英语、中文、日语、西班牙语、德语等多语种开展互动,方便全球用户体验。6)开放群聊功能。在一个聊天框中,用户在Glow内只能同一个机器人聊天;而Character.AI允许建立“群聊”,用户可将自己创建或平台其他用户创建的不同机器人拉入同一聊天框内,机器人之间、用户与机器人之间,可就特定话题开展聊天。我们认为,机器人之间互相接话的设定,既为用户提供了多人聊天的氛围,也促进了机器人的自我迭代。

第二章:重点企业分析

2.1、中文在线:ChatGPT、文心一言等提升产品互动体验

海外互动类内容产品已接入ChatGPT。据公开投资者交流,公司的海外产品Chapters和My Escape均已在做接入ChatGPT的测试,应用在故事创作生成、剧本生成及改编、用户与AI交互聊天等方面,为创作降本增效、丰富剧情,并让交互聊天更沉浸。1)Chapters:为互动式阅读类游戏,包含众多视觉小说和对话体小说,玩家以对话形式体验不同的故事,不同的选择将会通向不同的故事走向和结局。此外,Chapters也引入了AI绘画功能,通过文生图,来提升视觉小说的沉浸感和互动效果。2)My escape:为虚拟恋爱互动故事游戏,用户与多位虚拟男友女友进行互动、匹配、虚拟约会等,也有丰富的互动小说作为背景剧情。

文心一言、AIGC赋能元宇宙空间。公司打造的以《流浪地球》为世界观基底的科幻元宇宙空间APP RESTART中,所有场景、人物、道具以及配乐等均由AIGC参与创作完成,目前已完成场景搭建。此外, RESTART核心形象女娲(NUWA)将率先接入百度“文心一言”,可与玩家对话,提升沉浸感和互动感。 文心一言也将运用在文字创作领域、虚拟人实时对话、IP元宇宙空间、教育业务以及其他AIGC技术的 应用场景中。

2.2、天下秀:AIGC有望改善虚拟文旅、社交领域的交互体验,并提高内容生成效率

与新华社发布“云游中国”,探索数字人+虚拟文旅。23年1月,天下秀与新华社共同发布文旅数字化 云平台“云游中国”,用户可定义自身虚拟数字人形象、购买数字藏品装扮、剧情化游览虚拟景点等。 天下秀将提供AI交互及数字孪生、区块链、虚拟现实、3D引擎等技术。

有望改善“虹宇宙”内虚拟社交体验。天下秀于21年12月内测元宇宙社交应用虹宇宙,据公司公告, 截至22年6月底累计用户已超50万,用户可通过自定义虚拟形象,在平台内社交互动、产品试穿、收 藏数字藏品等,据公开投资者交流,已上线了拉菲、龙湖、小鹏、爱慕等品牌场景,还与敦煌、锦绣 中华、RPRSENTED等品牌及IP机构合作发布数字藏品,入驻了虚拟IP鱼太闲、天才小熊猫等红人与 粉丝互动。后续AIGC的引入,有望丰富虹宇宙内的虚拟内容供给、让NPC与用户的互动更智能化,从 而改善社交体验。AIGC工具升级。人人都是自媒体是公司全资控股公司北京五街科技出品的AIGC文字生产工具,具备 AI生成/修改文本、图片视频提取文字的功能。近日,该工具新增一键生成短视频等功能,提高多模态 内容生产效率。

2.3、新华网:子公司布局AIGC+虚拟人,发布元宇宙系统“元卯”

新华智云是由新华网和阿里巴巴成立的合资公司。新华智云科技有限公司主要布局媒体人工智能领域, 核心产品包括17年12月发布的媒体人工智能平台“媒体大脑” ,开始在媒体领域实践机器生产内容 (MGC),18年6月发布的短视频智能生产平台“媒体大脑·MAGIC”,进一步推动人工智能技术在媒 体、文旅、金融等领域集成化、产品化、商业化的应用。落地案例包括在18年两会期间用15秒发布关 于会议的MGC视频新闻,在俄罗斯世界杯期间制作赛事播报视频。

关注AIGC驱动的元宇宙系统“元卯”后续表现。3月22日,公司发布了全国首个AIGC驱动的元宇宙 系统“元卯” ,能生成文本、图片、视频与3D场景,从而降低虚拟人制作成本,日常使用数字人成本 低至1分钟1元,帮助媒体、文旅、金融等企业实现元宇宙数字人、数字内容、数字场景的智能化生产, 解决元宇宙内容生产成本高、效率低的问题。

2.4、蓝色光标:虚拟人将接入文心一言

虚拟人“苏小妹”等将接入百度文心一言。据投资者互动易,蓝色光标旗下元宇宙营销场景解决方案 公司蓝色宇宙,将接入百度生成式对话模型文心一言,将智能对话技术应用在AIGC营销场景,包括以 “苏小妹”为代表的虚拟人驱动与实时对话能力升级,及其他商业化解决方案,例如蓝标智播、分身 有术、MEME等产品的生产创造。 目前公司已发布“真的是苏小妹”小程序,可基于用户的文字提示创作诗词,也具备下载壁纸、语音 包等体验模块,关注后续产品开发。

将与OpenAI开展技术产品合作。据蓝色光标官方公众号及投资者互动易,成为中国区官方代理商后, 公司将与微软开展基于OpenAI的技术产品合作,让出海客户与海外消费者更好地互动。据蓝色光标官 方公众号,公司提出了与GPT-4可能的合作方式,包括驱动虚拟人的多模态个性化交互、生成NFT、 打造用于营销或社交的虚拟空间。

2.5、捷成股份:参股公司世优科技旗下数字人已接入ChatGPT,具备众多应用场景

数字人已接入ChatGPT,可应用在线下展厅、直播、电商等场景。据投资者互动易,公司参股世优科 技的数字人,已经接入ChatGPT,通过数字人自身的人设背景等相关数据,对其进行训练,并基于 OpenAI来训练数字人专有大脑,形成个性化模型,未来拟应用于线下展厅的AI讲解介绍数字人、线上 AI主播、AIGC快速短视频系统、智能客服、电商等多个场景。 已为众多头部客户打造数字人。世优科技已经为百度、央视网、海尔集团、脑白金等头部客户定制数 字人,用于品牌形象IP、智能助手等场景。其中,数字人“阿央”已经接入世优正在开发的ChatGPT微 信小程序——世优数字人元宇宙。该程序可以展示排行靠前的热门问题,并通过接入ChatGPT后的世优 科技数字人进行实时的内容解答。

2.6、天娱数科:将借助ChatGPT及文心一言,提升直播交互能力;也有AI制作视频能力

旗下“MetaSurfing-元享智能云平台”接入ChatGPT,并已引入TikTok直播场景。公司旗下的虚拟人 制作SaaS平台“MetaSurfing-元享智能云平台”,主要是为实现元宇宙人货场的“批量化、短周期、 低成本”制作,已应用在Tik Tok跨境电商直播、虚拟主播直播互动等场景。公司也在申请接入GPT-4。 1)形象制作:客户通过关键词与描述,即可实时生成符合直播与内容生成的虚拟形象。 2)直播交互:该平台已经接入ChatGPT等智能机器模型,输入商品的关键词描述,就可在选定的对应 的直播平台,使用选定语种,一键完成7×24小时的无人值守直播。

将接入文心一言,提升虚拟人交互等能力。据公司公众号,MetaSurfing-元享智能云平台也将接入百 度文心一言,将智能对话技术应用在元宇宙智能生产,及公司旗下的天妤等全体虚拟数字人,提升公 司在虚拟人交互体验、数字内容制作效率、元宇宙创意空间等方面的生产能力。 AIGC短视频生产工具可提高制作效率。公司的AIGC短视频生产工具“魔方Mix”,拥有AI批量混剪技 术、AI智能客服、可生成多种配音和方言等功能,可帮助广告主、内容方、MCN机构等提高制作效率。 目前魔方暂未向C端用户开放。

2.7、汤姆猫:核心“汤姆猫”IP与GPT能力结合,开发亲子互动产品

核心IP在家庭娱乐和亲子互动领域具备高知名度。汤姆猫以亲子品牌会说话的汤姆猫家族IP为核心, 打造了《会说话的汤姆猫》等超20款线上休闲益智移动应用,具备模仿人类说话、对用户的触摸/拍打 做出即时反应、打电话与玩家互动等玩法。据投资者问答,截至23年3月,汤姆猫系列移动应用产品累 计下载量超200亿人次,全球月活数超4亿,其中超80%的活跃用户来自海外。 筹集资金,加大AI教育相关产品、模型等投入。公司在23年2月发布公告,计划通过非公开发行股票 筹集资金,用于投向通用人工智能交互终端产品研发、预训练语言模型的自建与接入、IDC算力基础设 施建设。其中预训练语言模型将围绕公司擅长的情感陪伴、教育类等垂直领域,并接入公司研发的人 工智能交互终端产品及第三方机构的通识大模型。

2.8、奥飞娱乐:知名IP升级虚拟偶像,参股布局对话机器人,适用于教育场景

将陆续推出知名IP的虚拟偶像。据公开投资者交流,公司表示虚拟偶像应用场景丰富,如客串电视台 晚会嘉宾、驻场线下活动参与互动、线上参与带货助播等不同方式,为合作方提供多样选择。目前公 司已推出超级飞侠团队成员、巴啦啦魔仙女团-小蓝、严莉莉等人气角色的虚拟偶像,后续也将根据相 关运营情况打造更多的虚拟偶像。 参股公司布局对话机器人。据投资者互动易,奥飞娱乐持股5%的人工智能公司光年无限,拥有AI对话 机器人产品图灵机器人开放平台,在多模态交互等多项自研技术加持下,开发者可自行快速接入并创 建个性化机器人,例如聊天机器人、智能客服等,用于线上社群管理、虚拟人、语音助手以及儿童机 器人等智能硬件。

2.9、网易有道:将AIGC技术引入口语、作文批改等教育场景

网易有道:将AIGC技术引入教育场景。网易有道为国内的智能学习公司,旗下产品包括有道词典、有 道词典笔等软硬件学习工具,以及素养类课程、大学与职场课程等在线学习平台,有道全线产品月活 用户超1.2亿。据36氪,公司的AI技术团队近年来一直在AIGC上有持续性投入,2022年底已尝试将 ChatGPT同源技术运用到教育场景,包括AI口语老师、中文作文打分和评价等。据财联社,公司自研 的教育场景下类ChatGPT模型“子曰”将于近期推出;基于AI英语口语老师和中文作文批改场景的 DEMO也已完成,近期会开放内测。

报告节选:

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

24快报
JSON抓取失败