摘要:1月20日,开年出圈的“东方神秘力量”DeepSeek(深度求索)发布推理模型DeepSeek-R1,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型的推理能力,使得它在数学、代码、自然语言推理等任务性能上比肩OpenAI o1
5天时间,三家中国AI企业接连发布了三款对标OpenAI o1系列的大模型。
1月20日,开年出圈的“东方神秘力量”DeepSeek(深度求索)发布推理模型DeepSeek-R1,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型的推理能力,使得它在数学、代码、自然语言推理等任务性能上比肩OpenAI o1正式版,后者为OpenAI在2024年12月上线的推理模型。
与o1相比,R1的最大优势之一在于高性价比——API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中)、每百万输出tokens 16元,远低于o1每百万输入tokens 15美元(约合人民币110元)、每百万输出tokens 60美元(约合人民币437元)。也就是说,R1的价格约为o1的三十分之一。
更令外界兴奋的是,DeepSeek同步了开源模型权重,允许用户通过R1输出、蒸馏等方式训练其他模型;而o1并未开源,基本处于“黑匣子”状态。
1月21日,另一家中国大模型明星企业月之暗面推出了Kimi k1.5多模态思考模型。在long-CoT长思考模式下,k1.5的数学、代码、多模态推理能力达到OpenAI o1正式版水平;在short-CoT短思考模式下,k1.5的数学、代码、视觉多模态和通用能力,超越了OpenAI GPT-4o和Anthropic Claude 3.5 Sonnet。
Kimi k1.5尚未开源,但首次分享了,其中关键就是利用强化学习(RL)增强其推理能力:长上下文扩展和改进的策略优化建立了简单、有效的RL框架,无需依赖蒙特卡洛树搜索(MCTS)、价值函数和过程奖励模型(PRM)等复杂技术。
英伟达高级研究科学家吉姆·范(Jim Fan)指出,DeepSeek和Kimi都简化了RL框架,例如绕过MCTS,只需通过线性化思维轨迹,然后进行传统自回归预测;尽可能依赖事实和最终结果,而不是密集奖励建模。
1月24日,中国AI企业百川智能的全场景深度思考模型Baichuan-M1-preview正式上线,测试结果显示,它在数学、代码等多个权威评测中的表现超越了2024年9月发布的OpenAI o1-preview(预览版)。
除了推理能力,M1-preview还解锁了“医疗循证模式”,能精准回答医疗临床、科研问题,帮助用户做出医疗决策。
虽然测试结果并不完全等同于实际效果,但三款大模型为人工智能软件应用提供了新的思路——在先进GPU受限导致算力不足的情况下,中国大模型公司可以通过框架简化、模型蒸馏等算法创新,高效利用芯片资源,达到媲美巨头的产品性能。
“DeepSeek的新模型令人印象深刻,他们不仅有效地开发出一种开源模型,实现了推理时间计算,而且计算效率极高。” 1月22日,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在瑞士达沃斯世界经济论坛上表示,“我们应该非常认真地对待中国的发展。”
以DeepSeek为代表的中国AI企业,近期确实在海外引发了热议,甚至还有关于中国AI是否超越美国的探讨。我们应该清醒地认识到,前期探索工作的投入成本“浪费”是必须的,站在巨人肩膀上的后发优势值得鼓励,但无需太过骄傲,更不要让噱头盖过了真实。AI应用当然很好,也很重要,但只有当我们有更多实力来从事前沿探索性工作,才能称得上是真正的引领。
正如图灵奖得主、Meta AI首席科学家杨立昆(Yann LeCun)所说,“给那些看到DeepSeek 的表现后觉得‘中国在 AI 方面正在超越美国’的人,你们的解读是错的。正确的解读应该是,‘开源模型正在超越专有模型’。”
那边,美国宣布5000亿美元AI基础设施投资计划。
1月21日,在上任后的第一天,美国总统唐纳德·特朗普(Donald Trump)与OpenAI首席执行官山姆·奥特曼(Sam Altman)、软银首席执行官孙正义(Masayoshi Son)和甲骨文创始人拉里-埃里森(Larry Ellison)共同宣布,三家企业将联合成立名为“星际之门”(Stargate)的企业,在美建设支持AI发展的基础设施,并创造超过10万个就业岗位。项目初始投资为1000亿美元,并将在未来4年合计投资5000亿美元。
OpenAI公开了更多细节:Stargate初始投资者包括上述三家企业和来自阿布扎比的技术投资公司MGX。软银将负责财务,其创始人孙正义担任董事长,OpenAI负责运营。Arm、微软、英伟达、甲骨文和 OpenAI 是主要的初始技术合作伙伴。后三者将密切合作,共同构建和运营这一计算系统。
自2022年年末ChatGPT问世以来,全球AI领域投资激增,重心之一就是为AI提供算力支持的数据中心。OpenAI高级研究员诺姆·布朗(Noam Brown)评论称,如果以占GDP比重衡量,这一规模(5000亿美元)与阿波罗(登月)计划和曼哈顿(原子弹)计划相当。尽管包括埃隆·马斯克(Elon Musk)及部分媒体对5000亿美元的来源存疑,但这一项目代表着美国迫切想要保持AI领域领先地位的决心。
数据、算法、算力、人才,是AI发展的关键要素,缺一不可。
更值得关注的是,支持数据中心建设的同时,特朗普还在当地时间2025年1月20日撤销了美国前总统乔·拜登(Joe Biden)关于开发和使用安全、可靠、值得信赖的AI的行政命令,这意味着美国政府或转变对AI的监管态度,包括关键安全性和透明度要求。(曹妍)
企业动态
01 全球首套±800kV特高压直流量子电流传感器
1月22日,南网数字集团发布消息称,由南方电网公司输配电部牵头,南网数研院、南网传感公司、中科院上海微系统所、超高压输电公司、贵州电网公司、西安西电高压开关有限责任公司、中国科学技术大学、浙江大学等联合研制的±800kV特高压直流量子电流传感器通过新产品技术鉴定,成为全球首个可以应用于±800kV特高压直流输电线路的量子电流传感器。
研究团队利用金刚石内部独特的量子特性,通过检测电流产生的磁场来实现非接触电流测量,首次达成了1mA-10kA范围内万分之六的宽量程、高精度电流测量,从而可实时监测直流输电线路的运行情况和健康状态。
• 点评:量子传感器可类比为人体的“末梢神经”,时刻“感知”并测量数据,提高电力设备的测量精准度、稳定性和安全性。±800kV特高压直流量子电流传感器研制成功,标志着中国在量子精密测量领域取得重大突破。(曹妍)
02 乐普生物ADC新药达成国际授权合作
1月22日,乐普生物(02157.HK)宣布,将其消化道癌的抗体偶联药物(ADC)MRG007,授予ArriVent在大中华区(包括中国大陆、中国香港、中国澳门和中国台湾)以外地区开发、制造和商业化的全球独家许可。乐普生物将获得总计4700万美元的一次性首付款和近期里程碑付款,和最高达11.6亿美元的开发、注册和销售等里程碑付款,以及基于大中华区以外地区净销售额的分级特许权使用费,总交易额合计近12亿美元。
成立于2021年的ArriVent公司,是一家创新生物医药产品研发服务商,聚焦肿瘤学领域,通过与创新生物医药公司的战略合作,旨在使药品全球化。
• 点评:ADC药物将单克隆抗体与小分子细胞毒性药物通过连接子(Linker)偶联而成,利用抗体对肿瘤细胞的特异性结合能力,将小分子药物精准递送至肿瘤细胞内,发挥杀伤肿瘤的作用,是抗肿瘤药物研发的重要方向之一。此前中国已有科伦药业、荣昌生物、恒瑞医药等药企ADC药物达成国际授权合作。(郭吉桐)
03 OpenAI上线智能体Operator
1月23日,OpenAI首款AI智能体Operator上线,可自动执行从购买食品杂货到提交报销单等任务。它由CUA(Computer-Using Agent,计算机使用代理)驱动,是一种通过强化学习将OpenAI旗舰模型GPT-4o的视觉功能与高级推理相结合的模型,可以帮助人类操作电脑,遇到错误时还能自我纠正。
目前,Operator可供美国ChatGPT Pro用户使用,未来计划扩展至Plus、Team和Enterprise用户。
• 点评:智能体正从概念走向落地。2024年年末,Anthropic发布computeruse功能,谷歌推出基于Gemini2.0大模型的智能体Mariner,智谱AI也上线了手机端智能体AutoGLM。OpenAI入局,也将助推这一进程。(曹妍)
科学前沿
04 “人造太阳”EAST首次实现“亿度千秒”
1月20日,中国科学院合肥物质院等离子体所开发的全超导托卡马克核聚变实验装置EAST成功实现了上亿度1066秒稳态长脉冲高约束模等离子体运行,较EAST此前403秒的纪录延长约1.5倍,再次创造了新的世界纪录。
聚变三重积(等离子体温度、密度和约束时间的乘积)是衡量聚变效果的参数。由于地球上难以形成太阳内部的压强(控制密度),核聚变装置须将等离子体加热至1亿度以上,并且维持足够长的时间以触发核聚变反应。
托卡马克利用磁约束实现受控核聚变,也被誉为“人造太阳”。自2006年建成运行以来,EAST等离子体运行次数超过15万次,并在2012年、2016年、2017年和2023年,陆续实现30秒、60秒、101秒和403秒的高约束模。
• 点评:研制“人造太阳”的目标是复制太阳核聚变过程,为人类提供更为丰富的清洁能源。EAST实现“亿度千秒”的新成绩,验证了高约束模式稳态运行的可行性,是聚变研究从基础科学迈向工程实践的重要进展。(曹妍)
05 世界首个合成酵母基因组中最后一条染色体构建完成
1月20日,包括澳大利亚麦考瑞大学研究人员在内的国际科研团队在《自然·通讯》发表论文Construction and iterative redesign of synXVI a 903 kb synthetic Saccharomyces cerevisiae chromosome,报告他们完成了世界上首个合成酵母基因组中最后一条染色体的创建,并展示了如何设计、构建和调试工程染色体,以创造更具韧性的生物体、帮助在气候变化和未来流行病暴发时确保食品和药品生产的供应链安全。
该项目是国际酵母基因组合成计划(Sc2.0)的一部分。Sc2.0是合成生物学有史以来的最大项目,由来自英国、美国、中国、新加坡、英国、法国和澳大利亚等国的超200位科学家联合启动,旨在重新设计并合成酿酒酵母的全部16条染色体(长约12Mb,1Mb等于一百万个碱基对)。
• 点评:Sc2.0是人类首次尝试对真核生物的基因组进行从头设计合成,最后一条染色体重新建构达成,意味着项目的圆满完成,是合成生物学领域的一个重要里程碑。研究团队对 synXVI 染色体进行了一次人工重新设计,同时这一重新设计为 Sc2.0 策略在非酵母生物中的应用提供了路线图,这可能会彻底改变生产药物、可持续材料和其他重要资源的方式。(李一跞)
06 人类基因组完整改组图谱绘成
1月22日,冰岛基因解码公司(deCODE genetics/Amgen Inc.)科学家在《自然》(Nature)发表论文Complete human recombination maps,他们首次将非交叉(NCO)重组的情况纳入考量,利用家族全基因组序列数据,估算父母遗传给后代的NCO数量,绘制了一份包括交叉重叠(CO)和非交叉重叠在内的人类基因组完整改组图谱。
结果显示,基因重组(主要是NCO)分别导致1.8%、11.3%的父源和母源新生突变,并且新生突变可能随着母体年龄增长而增加。同时,NCO比交叉重组更能突出两性减数分裂(有性生殖生物在生殖细胞成熟过程中发生的特殊分裂方式)过程的差异。
• 点评:由于DNA序列具有高度相似性,NCO一直难以被检测,因此现有人类基因图谱仅基于交叉(CO)重组,此次绘成的人类基因组完整改组图谱,有望帮助科学家揭开“遗传变异密码”,从而更好地预防和治疗由基因引起的疾病,对人类健康有着深远影响。(曹妍)
南方周末科创力研究中心
责编 黄金萍
来源:南方周末