摘要:自DeepSeek横空出世以来,可以说经受住了全球挑剔严峻的拷问。从技术、算法、安全到舆论质疑以及所谓“蒸馏术窃取”,都被多次测试和验证一一澄清,不得不承认,中国原创的DeepSeek,对人工智能的发展具有前所未有的强大推动作用,一举扭转了全球AI的发展竞争格
OpenAI,应该改名CloseAI
自DeepSeek横空出世以来,可以说经受住了全球挑剔严峻的拷问。从技术、算法、安全到舆论质疑以及所谓“蒸馏术窃取”,都被多次测试和验证一一澄清,不得不承认,中国原创的DeepSeek,对人工智能的发展具有前所未有的强大推动作用,一举扭转了全球AI的发展竞争格局。根本原因是,中国是全球唯一一个在开源大型语言模型领域追求效率的市场。
2025年3月17日,是特朗普政府向学术界、企业界和公众征求制定“人工智能行动计划”意见的最后一天。在收到的8195份意见中,OpenAI、Anthropic、谷歌、IBM等企业以及美国商业软件联盟、美国商会、软件和信息产业协会等行业组织都公开了各自的提交意见。其中OpenAI和Anthropic成为恶毒攻击中国DeepSeek的急先锋。
3月13日,OpenAI全球事务副总裁Chris Lehane向白宫科学技术政策办公室提交政策提案,喊打喊杀,以“中美竞争”与“中国威胁”,“数据安全”“知识产权”“国家补贴”“国家安全”等极尽污蔑的陈词滥调,攻击诽谤DeepSeek。OpenAI的提案承认,美国在人工智能领域的领先地位正在被缩小,DeepSeek的最新大模型R1是一个“值得关注的进展”。其开源模型在技术上已足以与国际顶尖AI公司竞争。
DeepSeek“被国家控制、受国家补贴”,“与华为一样,在关键基础设施和其他高风险领域中,基于DeepSeek模型进行构建存在重大风险。”
中国能迅速动员数据、能源、技术人才、建立自身国内芯片研发能力所需的巨额资金等资源。要求特朗普政府全力封锁中国的AI进步和市场推广,像制裁华为一样对待DeepSeek。
实际上,OpenAI的一切焦虑都是因为DeepSeek。今年1月,OpenAI就毫无根据地指控DeepSeek通过“蒸馏”技术复制其技术,遭到全球专家和权威媒体嘲讽。CNN直指OpenAI虚伪,称其有意抹黑自己的竞争对手。并揭示OpenAI之所以叫这个名字,是因为建立目就是开源的非营利性公司。但在GPT-2之后,开源完全消失。为此美国媒体称其为“CloseAI”。
其险恶用心是,将AI技术实施三层“AI出口管制”,以“巩固美国AI领先地位,维护国家安全”。第一层是“可信赖的民主国家”,可以享受美国AI技术支持,但必须禁止使用中国制造的芯片和模型;第二层是未能阻止中国获取受限芯片的国家,将面临美国的限制;第三层赤裸裸地写明“中国等少数国家”,直接被排除在AI合作之外。同时,公开呼吁第一级国家推广针对中国的技术禁令,禁止使用中国生产的AI模型和AI基础设备。
OpenAI无端指责中国决心在2030年前成为全球领导者。这是为什么必须高度重视DeepSeek 发布的R1模型。这是衡量这场竞争状态的一个指标。这和中国华为公司一样,在关键基础设施和其他高风险使用中,如果一个系统构建在 DeepSeek 模型之上,会有巨大风险,因为 DeepSeek 可能会被迫受中国指令操纵其模型。
的确,DeepSeek的横空出世,让OpenAI罕见承认其闭源策略站在了历史“错误的一边”。
马斯克在X上发帖将OpenAI改为ClosedAI就撤销诉讼
早在1 月 30 日,美国 AI 公司 Anthropic 的 CEO 达里奥·阿莫迪(Dario Amodei)在个人博客发表“万字檄文”,指出对于 DeepSeek 的崛起,美国应该加强管制。
达里奥·阿莫迪,作为意大利裔美国人、是 OpenAI 早期研究团队人物之一、也是我国百度公司深度学习实验室早期员工。能力不济,但诽谤拙劣技能绝对一流。他号称将打造最强大和安全的 AI 的理想主义者。转身成为OpenAI 的竞争对手创始人。由于存在感实在难以提及,于是摇身一变成了最为激烈呼吁美国对中国 AI 全方位无死角封禁封杀封闭的推动者。
他极力推动出口管制政策。如果美国和其他民主国家的 AI 公司想要最终胜出,就必须开发出比中国更卓越的模型。我们不应将技术优势拱手让给中国。
他不得不承认,DeepSeek-V3 实际上是一项真正的创新,一个月前就应该引起人们的注意。作为一款预训练模型,它在某些重要任务上的表现似乎已接近美国最先进的模型水平,但训练成本却大大降低。DeepSeek 团队通过一些十分令人印象深刻的创新实现了这一点,同时这些创新主要集中在工程效率上。特别是在键值缓存(Key-Value cache)的管理上以及推动混合专家(MOE,mixture of experts)方法的使用上,DeepSeek 团队取得了创新性的改进。
第一个展示预期成本降低的公司是中国公司。这在以前从未发生过,并且具有地缘政治意义。
而在本次向美国提出的建议中,咬牙切齿怪像暴露无遗。他强烈建议政府加强对计算资源的出口管制,并对某些模型权重实施出口管制,以保持并扩大美国在AI领域的优势。
一是管制H20芯片,即使这些芯片在初始训练方面的性能不如H100芯片,但它们在文本生成方面表现出色。二是要求各国签署政府间协议以制定防止走私的措施。降低二级国家无需审查即可购买的H100芯片数量,以进一步降低走私风险,使其出口管制系统与美国保持一致。三是采取安全措施解决向中国走私芯片的问题,阻止与中国军方合作。
最具代表性的是美国软件和信息产业协会(SIIA)和IBM。
SIIA提交的意见中,建议特朗普政府不要对AI软件、云服务或AI模型实施出口管制,因为这些很难执行,并可能让美国企业相比中国竞争对手处于劣势。
IBM提交的意见指出,美国不应遏制开源AI的普及,而应强调美国在开源AI领域的领导地位,并将其作为国际交流中新的“AI外交”优先事项的基石。为了平衡美国开源AI扩散的需求和保护关键技术的需要,美国未来的出口管制和要求应侧重于硬件,即限制目标国家在特定数据中心和/或地理区域内并行部署GPU的数量, 而不是对AI模型权重或软件实施出口管制。
萨姆·奥特曼每天都在担心被“快速追击者”(Fast Followers)凭借更具可持续性的业务“后来者居上”,“每天醒来都在担心,我们希望这种事情不会发生在我们身上”。DeepSeek的出现,应验了奥特曼的深度焦虑。
1月份,萨姆·奥特曼在社交媒体X上发文称,“DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到其性价比。有新竞争对手出现确实令人振奋!”
但仅仅两周后,就开始诋毁DeepSeek通过“蒸馏”技术“违规复制”OpenAI的产品功能,并声称自己已经发现“证据”。
此举遭到业界和权威媒体鞭挞。
1月30日,CNN刊文指出:“现在,OpenAI想将DeepSeek塑造为恶棍。”美国科技界的领袖们正试图改变说法,让DeepSeek看起来像个坏人。”OpenAI的所谓“蒸馏”指控站不住脚。因为“蒸馏”并非剽窃,而是开发人员用来训练小型AI模型以使其性能达到更大、更复杂的模型的一种模仿策略。OpenAI,本来就是一家建立在未经许可从互联网上抓取的数据基础上的初创公司,正在指责另一家据称做着或多或少同样事情的初创公司。
2月1日,Meta首席科学家杨立昆(Yann LeCun)指出,硅谷一些圈子存在一种“常见病症”(a common disease)——错位的优越感(misplaced superiority)。患有这种“病症”的人认为自己所在的小圈子垄断了好想法,甚至认为其圈子以外的所有创新都是通过“作弊手段”得来的。
“正确的解读是:开源模型正在超越专有模型。DeepSeek提出了新想法,并在其他人的工作基础上进行了构建。由于他们的工作是公开且开源的,因此每个人都可以从中受益,这就是开放研究和开源的力量。”
在遭受围攻之际,奥特曼2月初在东京澄清,OpenAI“没有计划起诉DeepSeek”,该公司很高兴拥有一个新的竞争对手。2月11日,在英国《泰晤士报》“科技播客”(Tech Podcast)节目中,奥特曼直言,他对新挑战者的出现并不感到意外,但DeepSeek出现的时机确实让他大吃一惊。他再次赞赏DeepSeek在创建聊天机器人方面“工作出色”,尽管出现时机让他大吃一惊。他同时承认,DeepSeek的AI模型目前可与其公司的ChatGPT相媲美。在展示思维链条以及允许大规模免费应用方面,这些“显然都是用户期望的”功能。该模型“令人印象深刻”,有新的竞争对手也“令人振奋”。
奥特曼在节目上透露,他将与DeepSeek方面举行会面。
而本次向美国政府和特朗普举投名状,就在于垄断地位已经地动山摇,目的不仅卑劣而且惊慌失措。
DeepSeek R1推理成本远低于OAI
2月10日,埃隆·马斯克(Elon Musk)牵头组成投资者财团,以974亿美元报价竞购OpenAI的控股权。支持该收购的投资者包括Valor Equity Partners、Baron Capital及Palantir联合创始人Joe Lonsdale的风投公司8VC等。
埃隆·马斯克计划以974亿美元报价竞购OpenAI的控股权
马斯克意图极其明显。那就是捣毁山姆·奥特曼推动公司向营利性转型的战略计划,“现在是时候让OpenAI回到开源、安全至上的时代了。我们将确保实现这一点。”更重要的是,让奥特曼企图主导美国5000亿美元AI基础设施项目“星际之门”。自然,如果成功,马斯克进一步整合资源,让OpenAI与自己的xAI合并。即使奥特曼迅速回应“不,谢谢,但如果马斯克愿意,我们将以97.4亿美元收购推特”,但依然掩饰不了奥特曼的心慌意乱。
2015年,马斯克与奥特曼等共同创立OpenAI。最初定位为非营利组织,致力于开源和安全导向的AI研究。因理念分歧,2019年马斯克退出公司,奥特曼随即成立营利性子公司以吸引投资。2024年2月开始,马斯克以“违背创始使命”为由,连续三次起诉OpenAI,指控其通过营利化偏离了公益目标,并成立xAI与之竞争。
马斯克此举,即使不成,也让奥特曼的高估值图谋遭受重创。
1月27日,英伟达股票暴跌近17%,市值蒸发5927亿美元,创下美股史上最大单日市值下跌纪录。随即摩根士丹利发布报告称,将2025年英伟达GB200出货量从此前的3万—3.5万大幅下调至2万—2.5万件,最差的情况出货量可能低于2万,可能导致GB200供应链的市场影响达300亿至350亿美元。无独有偶,今年2月上旬,阿里巴巴网站上有大量全新的英伟达H800,A100,甚至包括大量H100。卖家甚至放出仓库储备的英伟达各种GPU视频作为证据。
当日,美国科学家、自然和人工AI专家、畅销书作家、企业家以及纽约大学心理学与神经科学教授加里·马库斯发表文章称:“AI霸权竞赛已经结束,至少目前如此,美国并没有获胜。”
研究机构Bernstein的分析师估计,DeepSeek的专业服务定价仅有OpenAI的同类模型的二十分之一甚至四十分之一。DeepSeeK AI模型在实现OpenAI模型同等性能时,仅需对方5%的算力。用H800芯片两个月跑出比肩GPT-4o的效果,其效率直接戳破了硅谷的AI泡沫。这意味着英伟达芯片之外有多款芯片可支持DeepSeekR1模型推理。更进一步说,算力需求的降低表明对训练和推理芯片性能要求显著降低,AI芯片供应多元化以及国产AI芯片替代都将成为现实。目前已经证实华为昇腾910B芯片的DeepSeekR1/V3推理云服务,AMD、海光旗下产品支持DeepSeekR1推理,硅基流动提供的DeepSeek模型推理服务与英伟达高端GPU媲美。
wen和 DeepSeek两个中国AI的“双引擎”
全球首批由chatGPT转用DeepSeek的企业,看到了DeepSeek这种降本增效的AI通道。尤其是欧洲众多初创企业率先使用已经尝到了甜头。德国Novo AI、英国NetMind.AI和丹麦Empatik AI等公司,都在庆幸自己从open AI转到deepseek。
NetMind.AI的CEO Seena Rejal称赞DeepSeek是改变全球人工智能规则、将AI推进民主化的伟大企业。这使无数科技初创中小企业,有机会与大型巨头企业展开公平竞争。丹麦公司EmpatikAI的首席执行官Ulrik表示,这为他们带来了巨大的机遇,显示出AI技术的可及性和可负担性。
deepseek的又一个“王炸”——文生图模型Janus-Pro,直接甩出700亿参数的开源版本。在GenEval和DPG-Bench两大权威评测中,Janus-Pro准确率冲到80%和84.2%,直接碾压OpenAI的DALL-E 3。
2月7日,美国Newsmax新闻网报道,对于“是否认为DeepSeek对国家安全构成威胁”的提问,特朗普当天对记者称,“不”。“这是一项正在发展的技术。实际上,我认为——我认为我们将从中受益。”“我们谈论的AI,将比人们最初想象的要便宜得多。这是一件好事。我认为这是非常好的发展,而不是糟糕的”。
特朗普:DeepSeek不会对国家安全构成威胁,美国将从中受益
实际,一切都在于Deepseek完全开源创举。
由于Deepseek的高性能和低成本特征,微软、英伟达、亚马逊、英特尔、AMD等美国以及全球科技巨头在第一时间上线DeepSeek开源模型推理服务。这就足以证明DeepSeek的强大之处。
其一,性能超强。2025年1月20日DeepSeek正式发布开源大语言模型DeepSeek-R1。在数学、代码、自然语言推理等任务上,超越了Qwen和Llama等其他开源模型,比肩闭源模型OpenAIo1以及Claude-3.5-Sonnet。
其二,成本超低。训练成本降低90%,推理成本降低95%。DeepSeek-V3和R1模型不仅性能出色,训练成本极低。V3模型仅用2048块H800GPU训练2个月,消耗278.8万GPU小时。而Llama3-405B消耗3080万GPU小时,是V3的11倍。按H800GPU每小时2美金计算,V3的训练成本仅为557.6万美金,而同等性能的模型通常需要0.6-1亿美金。
更宝贵的是,R1模型在V3基础上通过引入大规模强化学习和多阶段训练,进一步提升了推理能力,成本远远低于其它同类模型。基于R1模型的DeepSeekReasoner每百万输入Token成本为0.55美元,每百万输出Token成本为2.19美元。OpenAIo1每百万输入Token成本为15美元,每百万输出Token成本为60美元。DeepSeek-R1的API成本比OpenAIo1低95%。
其三,免费开源。DeepSeekR1直接面向全球开源,不仅允许所有用户无限商用,个人用户可以通过网、App客户端使用,而且可以接入DeepSeek的API付费使用,可以自己下载部署DeepSeek使用,或者直接在微软、亚马逊等第三方云计算厂商的DeepSeek模型服务。此举让全球用户以极低成本获得全球顶尖AI大模型服务,显然,DeepSeek开源让OpenAI的闭源垄断财源图谋彻底破产。模型壁垒破除,在开源大模型赋能下,DeepSeekR1的“低成本+高性能+全开源”生态,必将全面推动企业和个人用户对AIAgent、AI应用和AI商业化进程。
我们完全可以预见,特朗普政府对DeepSeek实施限制,无非是政府设备禁用DeepSeek;将DeepSeek应用从美国应用商店下架;限制美国本土云服务提供商向其客户提供DeepSeek 模型的方式。
但是,特朗普能如愿吗?谁还敢跟钱过意不去呢?显然推理算力全面爆发势不可挡。国内云计算厂商开始大幅投入满足算力需求。字节跳动2025年资本开支提升到1600亿元。阿里巴巴未来三年资本开支总额将超过过去10年3800亿元的总和,每年至少1200亿元。腾讯元宝接入DeepSeek,腾讯资本开支也将大幅上修。3月17日,阿里通义千问最新开源的推理模型QwQ-32B,在国际权威测评榜LiveBench中,超越OpenAI-GPT-4.5-preview、Google-Gemini2.0、DeepSeek-R1等顶尖模型,成为”全球性能No.1的开源模型“。全球业界公认最权威、最公正的大模型榜单之一LiveBench最新前十名榜单中,中国开源大模型包揽两席,分别是通义千问的QwQ-32B以及DeepSeek-R1,也是前十名中仅有的二家开源模型。全球最强的三个开源模型,中国就占据两席。
为迎接推理算力需求阿里腾讯大幅上调资本开支 引自第一财经
包括华为、阿里巴巴、龙芯中科在内的国产CPU龙头企业纷纷在3月公布或交付最新一代处理器。华为最新的麒麟X90主要可能主要面向消费级和政企市场,阿里玄铁C930、龙芯3C6000主要面向服务器市场。清华大学高性能计算研究所翟季冬教授团队与清华系创企清程极智联合宣布,大模型推理引擎“赤兔Chitu”正式开源。该引擎实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型,打破“硬件绑定”困境,为国产AI芯片的广泛应用和生态建设带来了新的突破。
Deep外交Seek未来
即使美国OpenAI和Anthropic如何煽动美国政府像制裁中国华为一样打压封锁DeepSeek,其等来的结果,必然是和美国使尽一切卑劣手段打压遏制中国华为公司一样,华为愈挫愈奋,反而以一己之力冲破美国科技七巨头的重重包围,牢固站在世界科技巨头的最高巅峰。就像美国前常务副国务卿、世行前行长佐利克所言:美国要和中国技术脱钩?看看DeepSeek是如何重塑全球AI竞争格局的吧!
来源:李国魂