国内

“AI界的拼多多”!雷军千万年薪挖角95后AI天才少女

中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。

最近,中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。DeepSeek-V3是深度求索自研的MoE模型(混合专家大模型),训练成本极低,被称为“AI界的拼多多”。

在DeepSeek-V3发布前几天,有消息称小米创始人雷军以千万年薪招募了一位95后的AI天才少女罗福莉,她将加入小米AI实验室并领导大模型团队。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

IMG_256

根据最新发布的技术报告,DeepSeek-V3的参数量为671B,激活参数为37B,预训练token量为14.8万亿。它在多项评测中超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等开源模型,并在性能上与顶尖的闭源模型如GPT-4o和Claude-3.5-Sonnet相当。

小米在AI领域的发力不仅体现在招募人才上。2023年4月,小米成立了AI实验室大模型团队,致力于挖掘AI相关的用户场景,并发挥自身技术优势。同年11月,小米还成立了专门的AI平台部,由小米的资深技术专家张铎负责。张铎曾得到雷军的公开称赞,被誉为“小米的大神”和“铎神”。

24快报
JSON抓取失败