AI周报|xAI发布大模型Grok 3;DeepSeek宣布将开源 5 个代码库

B站影视 2025-02-23 17:21 1

摘要:2 月 18 日,马斯克与 xAI 团队在直播中正式发布了 Grok 最新版本 Grok3。从现场展示的数据来看,Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称 Grok 3 未来将用于 SpaceX 火星任务计算,并预

xAI 发布 Grok 3 并开放免费使用

2 月 18 日,马斯克与 xAI 团队在直播中正式发布了 Grok 最新版本 Grok3。从现场展示的数据来看,Grok3 在数学、科学与编程的基准测试上已经超越了目前所有的主流模型,马斯克甚至宣称 Grok 3 未来将用于 SpaceX 火星任务计算,并预测“三年内将实现诺贝尔奖级别突破”。2 月 20 日,xAI进一步宣布Grok 3 开放免费使用(直至服务器崩溃)。随后,马斯克晒出了一张苹果应用商店免费应用下载排行榜的照片,显示Grok APP 超越 ChatGPT 应用登顶第一名。

点评: 马斯克将Grok3 称为“地球上最聪明的人工智能” ,xAI 称,Grok 3在 Colossus 超级计算机上运行,使用了 10 万个 Nvidia H100 GPU,训练时间长达 2 亿 GPU 小时。不过,模型跑分结果显示,Grok3相比 DeepSeek R1 以及 GPT4.0 ,差距不到 1%~2% ,不少用户通过实际测试认为“并无明显差别”。

DeepSeek发布最新技术论文,宣布开源 5 个代码库

2月18日,DeepSeek发布最新技术论文提及NSA(Native Sparse Attention),表示通过针对现代硬件的优化设计,NSA在提升推理速度的同时降低预训练成本且不牺牲性能。在这篇名为《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力机制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的论文署名中,DeepSeek创始人梁文锋也作为共创者在列。两天后,DeepSeek又宣布,接下来一周,会陆续开源 5 个代码库,DeepSeek 表示,这些在线服务中的基础构建模块已经经过文档化、部署,并在生产环境中经过实战检验。

点评:DeepSeek在公告中称自己是探索 AGI 的小公司,作为开源社区的一部分,每分享一行代码,都会成为加速 AI 行业发展的集体动力。同时,DeepSeek 称,没有高不可攀的象牙塔,只有纯粹的车库文化(不少美国著名企业从车库里诞生)和社区驱动的创新。

腾讯元宝成为苹果中国区免费APP下载榜第二名

2月22日,腾讯元宝超越豆包,升至苹果中国区APP下载排行榜第二名,第一名仍为DeepSeek。此前接入DeepSeek-R1和混元T1后,2月21日,腾讯元宝又进行了更新,元宝中的DeepSeek模型有了理解图片信息的能力。

点评:腾讯元宝、豆包、DeepSeek这类C端APP虽然还没有明确的商业变现方式,但这些APP的热度已经能反映大众对于使用大模型的热情。各个大模型APP中,接入DeepSeek模型的决定为元宝带来了明显的热度。

微信搜索接入DeepSeek

微信此前接入DeepSeek-R1模型,部分用户在微信搜索框选择AI搜索,可使用DeepSeek-R1的深度思考功能。2月18日,为方便更多用户使用DeepSeek,腾讯内部紧急协调部署,调用元宝支持微信搜索。微信表示,微信搜一搜小范围测试接入DeepSeek,用户的使用热情远远超出预期,目前资源紧张。不在灰度测试范围内的部分微信用户进入微信搜索,会在页面中看到“下载元宝(体验DeepSeek-R1)”。

点评:腾讯旗下产品接入DeepSeek可为内容带来增量流量。腾讯元宝APP早于微信搜索接入DeepSeek-R1。腾讯元宝去年刚上线时并未借腾讯渠道能力做大规模投放。不过,近期接入DeepSeek-R1以及在微信搜索处吸引用户下载,腾讯元宝可能会借势收获一波新用户。

前OpenAI CTO成立新公司Thinking Machines Lab

北京时间2月19日凌晨,前OpenAI CTO米拉·穆拉蒂(Mira Murati)在社交平台上表示,她和一群杰出的科学家、工程师一起创办了一家名为Thinking Machines Lab(思考机器实验室)的公司。这家公司要做的三件事是:帮助人们调整AI系统以满足他们的特定需求;为构建更强大的人工智能奠定基础;培育开放的科学文化并帮助整个领域理解和改进这些系统。

点评:据Thinking Machines Lab网站,这家公司的团队有29名成员,其中不少来自OpenAI。例如,OpenAI联合创始人约翰·舒尔曼(John Schulman)担任首席科学家,前OpenAI研究副总裁巴雷特·佐夫(Barret Zoph)出任首席技术官,前OpenAI安全研究副总裁翁荔也加入这家公司。米拉·穆拉蒂于去年9月宣布她决定离开OpenAI。多名OpenAI创始团队成员及核心技术人员离职创立新公司或加入其他AI公司,将使OpenAI拥有更多竞争对手。

腾讯股价重返500港元/股

2月18日收盘,腾讯股价重新站上500港元/股。从1月中旬开始,腾讯控股股价就迎来波动上涨,1月13日收盘366港元/股,2月21日收盘为517港元/股。消息面上,腾讯旗下微信AI搜索已接入DeepSeek-R1,腾讯旗下多个应用也接入了大模型。此外,对DeepSeek的关注,近日在资本市场上引发了对中国资产进行重估的情绪。此前,腾讯股价曾在2021年初站上700港元/股。

点评:多家机构近日都在热议中国资产重估。中金公司认为本轮反弹的本质是建立在对科技趋势的乐观情绪上,主要催化因素是DeepSeek“破圈”带来对科技和整体中国资产的重估情绪,高盛则指出,DeepSeek的崛起为中概科技股带来了中长期价值重估的机会。资本市场对国内科技公司有了更大期望,这也建立在AI技术突破能转化为实际收入的预期上。

月之暗面收缩产品投放预算

近日有消息称,月之暗面近期决定大幅收缩产品投放预算。月之暗面内部对此次调整解释称,公司近期受到“外部因素和内部战略调整影响”。知情人士表示,此次调整背后,DeepSeek带来的热潮带动了大众对AI的认知提升,近期Kimi自然新增用户量猛涨。

点评:在DeepSeek火爆之前,Kimi是国内知名度最高的C端AI应用之一。DeepSeek证明了,在模型性能足够好的情况下,不需宣传投放,用户就会自然增长。包括月之暗面在内,大模型厂商都需要重估投放广告宣传的意义。

阿里AI To C业务人员招聘开放招聘达到数百个

阿里AI To C业务近期开启大规模人员招聘,开放招聘岗位达到数百个,其中,AI技术、产品研发岗位占比达到90%,所招聘人员将重点投入到文本、多模态大模型、AI Agent等前沿技术与应用的相关工作中。2 月初,全球顶尖人工智能科学家、前 Salesforce 集团副总裁许主洪出任阿里集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案。有消息称,许主洪目前正在紧锣密鼓筹备规模超百人的顶级 AI 大模型研究团队。

点评:阿里AI To C业务正在加强人才储备。全球大模型公司都在抢夺优秀人才。AI应用方面,阿里也在发力。阿里 AI To C 代表产品夸克近期还将品牌标语升级成为“2 亿人的AI全能助手”。

微软推出世界首款拓扑架构量子芯片

当地时间2月19日,全球首款拓扑量子芯片Majorana 1发布,该芯片由微软公司历时近20年研发,有望于2030年之前上市。微软的目标是未来在量子芯片上实现百万个量子比特的相干操纵。微软董事长兼CEO萨蒂亚·纳德拉发文宣布:“这一突破将使我们在几年内,而不像一些人预测的那样用几十年,创造出一台真正有意义的量子计算机。”

点评:技术专家相信,量子计算机有朝一日可以完成当今系统需要数百万年才能完成的计算,有效地解决传统计算机难以解决甚至不可能解决的问题,并在医学、化学和许多其他领域带来新的发现。但业内对于这一愿景何时实现,长期以来存在争议。英伟达创始人CEO黄仁勋上个月表示,量子技术距离超越英伟达芯片还有20年的时间,目前AI芯片仍是人工智能的主力军。而谷歌等公司则认为,这一时间点预计将在5年内达到。

谷歌17年老将吴永辉加入字节跳动

有消息称,在谷歌工作长达 17 年的吴永辉博士已离开谷歌,加入字节跳动。吴永辉在字节跳动将担任大模型团队 Seed 基础研究负责人,专注大模型基础研究探索、AI for science 等偏长期的研究探索工作,向字节跳动 CEO 梁汝波汇报。字节跳动相关人士向媒体确认了这一消息。

点评:在此次调整前,在内部全员会上,字节跳动 CEO 梁汝波刚刚反思了公司在 AI 领域的短板,包括对重大技术的跟进速度不够。据悉,吴永辉2008年加入谷歌,2014年加入Google Brain并转向深度学习方向的研究,是Google神经机器翻译项目及RankBrain项目的主要贡献者之一。知情人士称,吴永辉离开谷歌,是希望做一些新的、偏探索性的工作。这次加盟字节,也将专注在偏长期、偏基础的科研工作。

瑞金医院与华为发布病理大模型

在近日召开的2025医疗人工智能与精准诊疗发展论坛上,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。这一大模型旨在提高病理识别效率和准确率,它基于瑞金医院丰富的病种和高质量的医疗数据,覆盖中国每年全癌种发病人数90%的常见癌种,以及垂体神经内分泌肿瘤等罕见病。华为的DCS AI解决方案扫清了大模型落地的障碍,支持数据工程工具化 ,模型与应用对接标准化,以及有效降低部署成本。

点评:医疗是人工智能技术发挥巨大作用的领域。在DeepSeek发布之后,国内多家医院已经将其引入医疗生态。大模型进入医院已经成为一股潮流,瑞智病理大模型RuiPath是最新的一例。人工智能的技术能力不断提升,部署成本则在逐渐降低。瑞金医院和华为是各自领域的前沿探索者,瑞智病理大模型的落地有望起到示范性作用。

阶跃星辰将在3月份开源图生视频

2月21日,阶跃星辰CEO姜大昕在生态开放日表示,公司将在3月份开源图生视频大模型。此前,阶跃星辰已经开源一款视频生成大模型以及一款语音交互大模型。截至目前,阶跃 Step 系列模型矩阵已经发布了 11 款多模态大模型,覆盖语音识别、语音生成、多模态理解、图像及视频生成能力。

点评:DeepSeek发布的开源大模型,在国内和国外产业界都引起极大关注。它也可能改变国内大模型企业的发展策略,此前百度是闭源的坚定捍卫者,目前也已经转向了开源。百度、阶跃星辰等大模型企业加入开源生态,对于人工智能技术的扩散和产业培育都有积极的促进作用。姜大昕认为,产业正朝着实现AGI(通用人工智能)的目标稳步前进,目前已进入智能体的发展阶段。

编程初创公司Codeium获新一轮融资,估值达28.5亿美元

2 月 20 日消息, AI 驱动的编程初创公司 Codeium 正进行新一轮融资,估值达到 28.5 亿美元(当前约 207.57 亿元)。这轮融资发生在 Codeium 宣布完成 C 轮融资仅六个月之后。当时公司获得了 1.25 亿美元的资金,融资后估值为 12.5 亿美元(当前约 91.04 亿元)。

点评:知情人士透露,Codeium 目前的年化经常性收入(ARR)约为4000万美元。根据这一数据,Codeium的隐含估值大约是ARR的70倍,这一倍数远高于其他 AI代码编辑公司。上个月,AI编程助手 Cursor 的制造商 Anysphere 宣布了一轮新融资,估值为 25 亿美元,根据其报告的1亿美元收入,投资者认为其估值是25倍ARR。

来源:科技pioneer

相关推荐