年薪千万?离职DeepSeek后罗福莉宣布入职小米MiMo大模型团队

B站影视 韩国电影 2025-11-13 13:46 1

摘要:2025年11月,95后AI研究员罗福莉通过朋友圈发声“我正在XiaomiMiMo”,正式确认加盟小米大模型团队。这一官宣为持续近一年的“雷军千万年薪挖角”传闻画上句号。

2025年11月,95后AI研究员罗福莉通过朋友圈发声“我正在XiaomiMiMo”,正式确认加盟小米大模型团队。这一官宣为持续近一年的“雷军千万年薪挖角”传闻画上句号。

事实上,双方合作早有伏笔。2025年10月,小米与北京大学联合发表的MoE(混合专家)与强化学习领域论文中,罗福莉已位列通讯作者,其研究方向与XiaomiMiMo的核心技术路径高度契合。而她在9月点赞小米语音大模型Xiaomi-MiMo-Audio开源动态的行为,也被外界解读为加盟前的信号。

此前2月,罗福莉亲属曾证实其入职新单位,但未披露具体去向,小米内部系统当时也未显示其信息,直至此次官宣终告落地。

从顶会新星到开源先锋

罗福莉本科就读于北京师范大学计算机专业,保研至北京大学计算语言学研究所后,于AI领域顶级国际会议ACL发表8篇论文(含2篇一作),两年内累计发表顶会论文超20篇。

职业生涯中,她先后任职于阿里达摩院、幻方量化DeepSeek等机构。在阿里达摩院期间,她主导开发多语言预训练模型VECO,成为开源项目AliceMind核心组件,奠定跨语言大模型研发经验。加盟DeepSeek后,作为关键开发者参与MoE架构大模型DeepSeek-V2研发,该模型以1元/百万Tokens的性价比(GPT-4的1%)和顶尖中文处理能力,被业界评为“闭源模型第一梯队”。

值得注意的是,罗福莉本人始终淡化“天才少女”标签,2025年2月曾发文称“只想安安静静做难而正确的事情”,但其技术成果已获得行业广泛认可。

技术互补加速小米AI生态落地

罗福莉加盟的核心载体——XiaomiMiMo大模型,是小米于2025年4月30日开源的首个推理专用大模型,其最大突破在于打破“参数规模决定性能”的行业铁律,以7B轻量化参数实现超越32B模型的性能表现。

小米官方披露,MiMo的性能突破源于全链路技术革新:

三阶段预训练:基于200Btokens专项推理语料库,通过“基础能力→STEM强化→长文本突破”阶梯训练,累计训练量达25Ttokens;

强化学习革新:独创TDDR(TestDifficultyDrivenReward)机制,解决“难题摆烂”问题,搭配EasyDataRe-Sampling策略,训练稳定性提升40%;

工程效率突破:自研SeamlessRollout系统实现异步奖励计算,训练速度提升2.29倍,验证效率翻倍。

目前MiMo已开源4个版本(基础预训练、监督微调及两个强化学习版本),教育机构已基于其开发AI解题助手等应用。

罗福莉的加盟被业界视为“强强联合”。其在MoE架构、强化学习、开源生态运营等领域的经验,与XiaomiMiMo的技术路线高度契合——MiMo采用的混合专家模型架构,正是罗福莉在DeepSeek-V2研发中的核心擅长领域。

从行业格局看,当前手机厂商正加速大模型端侧落地,MiMo以“轻量化、高性能”为差异化优势,而罗福莉主导的跨语言模型研发经验,或将助力MiMo拓展多语种推理能力,进一步适配小米全球智能设备生态。雷军此前曾公开表示,小米大模型研发的核心目标是“让AI技术惠及每一个用户”,而罗福莉在开源社区的深厚积累,将为MiMo生态的开发者共建提供关键支撑。

轻量化大模型成终端AI竞争焦点

罗福莉加盟小米的背后,是终端厂商大模型竞争的升级。数据显示,2025年以来,7B-13B参数的轻量化模型成为行业布局热点,其在推理速度、硬件适配性上的优势,更符合手机、智能家居等终端设备的应用场景。MiMo的开源策略已吸引超万名开发者参与调优,而罗福莉的加入有望进一步提升其技术迭代速度,与华为盘古、OPPOAndesGPT等形成差异化竞争。

对于罗福莉个人而言,从阿里达摩院的预训练模型研发,到DeepSeek的开源大模型实践,再到MiMo的端侧推理突破,其职业路径始终聚焦“技术落地”核心。此次加盟小米,或将成为其实现“难而正确的事情”的新起点。

来源:DLA点线圈科技

相关推荐