阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”_产品_产业

产品

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

来源：财联社
2023-06-12 18:18

阿里达摩院的研究人员提出了Video-LLaMA，一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号，并能理解用户输入的指令，完成一系列基于音视频的复杂任务，例如音/视频描述，写作，问答等。

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

阿里达摩院的研究人员提出了Video-LLaMA，一个具有综合视听能力大模型。Video-LLaMA能够感知和理解视频中的视频和音频信号，并能理解用户输入的指令，完成一系列基于音视频的复杂任务，例如音/视频描述，写作，问答等。目前论文，代码，交互demo都已开放。另外，在Video-LLaMA的项目主页中，该研究团队还提供了中文版本的模型，让中文用户的体验更好。

阿里达摩院开源Video-LLaMA 帮大语言模型加上“眼睛”“耳朵”

关键词

相关阅读

讯飞星火大模型V1.5发布：综合能力三大升级，发布星火APP

AI大模型引领智能生产，工业领域迎来“兴奋时刻”

华商基金看行业之人工智能：AI大模型蓬勃发展应用与算力强势出击

又一 AI 大模型重磅发布，企商在线为其筑牢智能算力底座

Gomu获得B轮融资携手XstarClub开启NFT新模型

“腰部”大模型，活在故事里

李开复谈AI 2.0：自主创新是中国人工智能大模型必经之路

人工智能可准确识别早期癌症？英国开发AI模型提升精准度

腾讯音乐申请“文曲大模型”系列商标，已有多个AIGC应用落地

脑机接口重磅成果发布，微美全息（WIMI.US）深耕研发BCI游戏模型和范式

24快报

北京联通携手华为、工体元宇宙在新工体打造全球领先的5G-A立体组

香港eTeam：打造元宇宙“异世界”，为玩家带来电影级沉浸体验

Meta自2020年以来元宇宙部门亏损超580亿美元

苏州市精准布局元宇宙赛道，总产值达5万亿元

天津市新政：创办元宇宙未来产业企业最高获30万元支持

首个红色文化元宇宙XR数字展览《中轴之核-天安门印迹》亮相

OpenAI频陷侵权风波，印度媒体索赔2000万卢比

重庆大足石刻景区：虚拟数字人上线，元宇宙技术让古老石刻会 "

元宇宙VR大空间展现多领域发展潜力，将电影场景变为现实

元宇宙文旅热潮“解锁”文化消费新业态

中国移动咪咕发布鼓浪屿元宇宙商业生态合作计划

“元宇启新梦·虚实创未来”江西省互联网大会元宇宙分论坛在南昌

深耕元宇宙，瓣鼎科技CEO史明荣获行业大奖

强制出售Chrome？OpenAI或成潜在买家

工信部：AI大模型公共服务平台启动！加快大模型技术迭代和产品升

擅自收集敏感数据韩国处罚“元宇宙”1560万美元

阿里元境调整元宇宙行至岔路口

瓣鼎科技持续在元宇宙行业释放魅力，致力开启潮流新篇章

二六三：公司在元宇宙方向上主要聚焦在3D虚拟直播及数字人的探索

韩国对Meta罚款1560万美元！Meta擅自收集敏感数据