这款产品被视为对OpenAI三个月前推出的文本转视频工具Sora的直接挑战。
据悉,PaliGemma 是谷歌受 PaLI-3 启发的第一个视觉语言模型。而且,谷歌还使用 LLM Comparator 升级了 Responsible Generative AI Toolkit,用于评估模型响应的质量。
4. 改进版Gemini 1.5 Pro:具有100万令牌上下文能力的 Gemini 1.5 Pro 也可供 Gemini Advanced 的消费者直接使用,包含 35 种语言。
7. AI Overviews:采用了先进的AI技术,使用户能够通过提问、聊天的方式进行搜索。名为Ask Photos的功能将于今年夏天推出。