小米AI新动态/GPT-5研发滞后/Cursor又融资

B站影视 2024-12-23 12:18 1

摘要:小米 AI 实验室自 2016年成立以来,已拥有约 250 人的专业团队,研究方向涵盖了视觉、声学、语音、自然语言处理(NLP)、知识图谱、机器学习和大模型等多个领域。去年 4 月,小米更是成立了专门的大模型团队,由栾剑担任负责人,致力于模型的轻量化和本地部署

一、雷军斥巨资招募大模型领军人物

据第一财经报道,小米公司最近力邀一位 AI 领域专家入职:原 DeepSeek 开源大模型 DeepSeek-V2 的核心开发者罗福莉。

罗福莉或将加入小米 AI 实验室,领导小米在大模型领域的研发团队。

有知情人士透露,雷军对小米在大模型领域的起步较晚感到忧虑,因此亲自出手,以千万级别的薪酬招募能够引领小米大模型发展的顶尖人才。

小米 AI 实验室自 2016 年成立以来,已拥有约 250 人的专业团队,研究方向涵盖了视觉、声学、语音、自然语言处理(NLP)、知识图谱、机器学习和大模型等多个领域。去年 4 月,小米更是成立了专门的大模型团队,由栾剑担任负责人,致力于模型的轻量化和本地部署。

目前,小米已研发出 MiLM 系列模型,并升级至第二代 MiLM2,部分模型已在小米的产品中得到应用。

罗福莉的加入就是小米发力大模型领域的发展的决心体现。她毕业于北京大学计算语言学研究所,并在自然语言处理领域取得了杰出的研究成就。在阿里巴巴达摩院机器智能实验室工作期间,她主导开发了多语言预训练模型 VECO。

并且,她还参与了 DeepSeek 的 Mo E大模型 DeepSeek-V2 的开发工作。

业内人士认为,罗福莉的加盟将加速小米在大模型领域的研发进度,推动小米在 AI 领域的进一步发展。

二、OpenAI GPT-5 研发进度滞后,或将延期发布

OpenAI 的 GPT-5 研发进度出现了明显的滞后,预计将不能按时发布。

据悉,代号为猎户座(Orion)的 GPT-5 开发周期已经超过 18 个月。原本,微软作为 OpenAI 的“金主”,预计 GPT-5 能在 2024 年中发布。

但现在种种信号指出,由于研发过程中遇到了一系列挑战和困难,GPT-5 的发布时间不得不推迟。

OpenA I为 GPT-5 设定了极高的目标,但经过多轮大规模训练后,效果并未达到预期。据估计,六个月的训练运行成本高达约 5 亿美元。此外,研发过程中还出现了数据多样性不足的问题,进一步加剧了研发难度。

为了应对这些挑战,OpenAI 开始寻求新的解决方案。他们招聘了软件工程师和数学家来编写代码和解决数学题,为猎户座提供学习材料。同时,他们还寻求专家合作,利用推理模型 o1 生成合成数据,并结合传统数据来不断改进模型生成结果。

尽管 OpenAI 付出了巨大的努力,但 GPT-5 的研发进度仍然滞后。目前,OpenAI 又将注意力转向其他项目,包括开发 GPT-4 的各种版本和 Sora 等。这一举动可以说是在巩固当下的优先,但同时这一转变导致开发新产品的团队和猎户座研究人员之间为争夺有限的计算资源产生了激烈的竞争。

此外,近期 OpenAI 还面临了人才流失的问题。包括 Ilya Sutskever、Mira Murati、Alec Radford 在内的 20 多名核心高管和资深员工相继离职,给 OpenAI 带来了不小的冲击。

三、AI 编程助手 Cursor 四个月内再获 1 亿美元融资

人工智能(AI)编程助手 Cursor 的开发商 Anysphere,近期获得 1 亿美元的 B 轮融资,估值达 26 亿美元。

本轮融资由老股东 Thrive Capital 领投,而在此之前不久,Anysphere 仅在刚刚完成由 Andreessen Horowitz (a16z) 领投、Thrive Capital 参投的 6000 万美元 A 轮融资,当时估值为 4 亿美元。a16z 也参与了本轮融资。

AI 驱动的编程助手市场竞争激烈,涌现出 Augment、Codeium、Magic 和 Poolside 等众多产品,这些工具也在追赶微软的 GitHub Copilot,而就市场的欢迎程度上看,目前都不能与 Cursor 相提并论。

来源:DG数码

相关推荐