华为云突破“制裁”的密码,藏在超节点里

B站影视 韩国电影 2025-05-19 18:20 1

摘要:美国逆全球化的举动遭到了中方的强硬还击,双方就此展开了多轮的博弈。终于在5月11日,迎来了短暂的结局。中美达成关税休战协议,暂停部分加征关税,保留10%基准税率,并设置90天缓冲期。

4月2日,美国对世界开启了大范围扫射,亮出一张“对等关税”牌。

政策中,10%的基准关税于4月5日生效,而对不同贸易伙伴的更高关税则从4月9日开始实施。此后,美方更是将针对中国商品加征关税的税率提高到145%。

美国逆全球化的举动遭到了中方的强硬还击,双方就此展开了多轮的博弈。终于在5月11日,迎来了短暂的结局。中美达成关税休战协议,暂停部分加征关税,保留10%基准税率,并设置90天缓冲期。

为遏制中国在全球性竞争,美国打出了关税与技术的“组合拳”。一方面把关税杠杆作为地缘经济博弈工具,另一方面又将芯片技术封锁升级为结构性战略壁垒。

从美国扩大芯片出口管制,禁售英伟达H20、L20等“中国定制化”AI芯片,再到宣布“不准全球使用华为昇腾AI芯片”等管制措施。悬在中国科技行业头上的“达摩克利斯之剑”始终存在,而国内中国企业AI创业热情高涨,大模型事业正在如火如荼地进行中。

在层层压力传导之下,中国企业没有坐以待毙。我们观察到,自5月14日起,华为云CloudMatrix 384超节点的一幅广告开始攻占国内多地机场。

据悉,就在上个月,华为云在生态大会上发布了中国AI领域的突破——CloudMatrix 384超节点,以384张芯片,300P算力的硬核技术终结“算力焦虑”,让世界看到了中国科技的爆发力。

正值中美关税迎来关键转折点,华为云在此时大范围投放机场广告屏,暗含了怎样的技术底气?又释放出哪些行业积极信号和产业价值?

重压之下,中国科技力量破局

忌惮中国科技力量的崛起,美国对华芯片制裁由来已久。据光子星球不完全统计,截至5月13日,仅2025年,美国已相继出台了八项针对中国芯片行业的政策。

透过表格观察,美国针对中方的芯片制裁政策具备三个特点。一是技术封锁逐渐精准化,从限制芯片制程扩展到AI模型权重和HBM芯片等新兴领域;二是遏制芯片全链条供应链,覆盖了从芯片设计、制造、封装、设备等全环节;三是对关键领域精准定向打击,例如对英伟达H20下达禁令,其作为中国市场唯一合规的AI芯片,相当于阻断了中国大模型推理需求。

但若将时间线再拉长,就会发现美国对华芯片制裁不是一蹴而就。在对华制裁政策制定中,美国在过程中多次呈现出摇摆不定和左右手互搏的特点。

具体的案例比比皆是,比如美国既担忧中国AI技术超越,又试图通过放宽部分管制维持市场份额,暴露其“既要遏制对手,又难舍弃利润”的矛盾心态。今年1月,美国将制裁重点放在16nm/14nm以下制程芯片、HBM存储芯片及AI模型权重上。但因中国28nm芯片全球市占率突破30%,美国又于3月提出对28nm及以上成熟制程加征关税,试图削弱中国成本优势。

尽管美国对华芯片制裁政策朝令夕改,但也在近期逐渐达成共识,即放弃技术全面脱钩,被迫转向对技术精准管控,形成一种“被打出来的和平”局面。

深究原因,这种“和平”源自于近些年来中国科技的崛起和突破。

最突出的是国产替代化进程加速。有数据显示中国半导体设备国产化率从2018年的12%提升至2024年的40%以上。在AI芯片领域,华为昇腾芯片性能逼近英伟达。这些突破使美国“全面封锁”策略失效,转而采用“精准限制”以保留谈判筹码。

中国科技行业正试图将制裁压力转化为创新动力,最终迫使美国接受多极技术格局。本质上,“和平”表面之下其实是中国科技持续突破的底气在支撑。由此,也让中国在国际谈判上拿到更多话语权。

一如美国惯常的做法,短暂的“和平”也可能随时被打破。在制裁反复无常的大背景下,中国科技行业仍要时刻居安思危,华为云上个月发布的CloudMatrix 384超节点正是科技底气和创新的双重体现。

CloudMatrix 384超节点破AI算力焦虑

2019年,美国把华为加入美国商务部实体清单,直接断供。被制裁后的六年间,华为已经学会在高压下磨砺前沿科技技术,就像广告屏中掀起惊涛骇浪,但华为云CloudMatrix 384超节点犹如定海神针一般稳如泰山,开辟出前进的道路。

CloudMatrix 384超节点是华为拿下AI高地的关键一城,堪称算力焦虑的“终结者”。

“超节点”一词在智算领域升温,用于解决AI大模型算力问题。超节点技术的核心创新在于对等互联架构。一个形象比喻是,在传统架构中,各个部件像一座座孤岛,数据需要层层摆渡,而超节点技术则将所有设备连成一片大陆,让数据得以快速流动。

华为云副总裁黄瑾指出,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁,超节点架构的诞生不仅是技术的突破,更是以工程化创新开辟AI产业的新路径。

华为云推出采用全对等互联架构的CloudMatrix 384超节点。该项技术跳出单点技术限制走向系统性、工程性的创新算力架构,直面通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战。

这里面处处是“经济账”。以面积换算力和性能,虽然单颗昇腾芯片的性能为英伟达Blackwell GPU的三分之一。但通过集群规模优势将总算力规模提升50倍,最高提供300Pflops的算力规模,比业界同类产品领先67%。

众所周知,大模型存在“摩尔定律”,即模型参数越大,性能迭代越快。但参数越大对硬件和算力的考验就越大,考虑到物理极限挑战,华为云的解决思路是以“以非摩尔补摩尔”。便是以软实力增强硬实力,以系统性的创新来构建优势。一切皆可算力,“以空间换算力、带宽换算力、能源换算力”。

CloudMatrix 384超节点作为AI基础设施架构,无法直接对外提供服务,云成为了最佳渠道。目前,华为云是业界唯一采用对等架构超节点技术提供算力服务的云厂商。昇腾AI云服务是其坚实的底座,构建了从芯片到平台的全栈自主创新体系,并形成生态体系。

华为云CloudMatrix 384超节点具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大领先技术优势,以系统架构创新重新定义新一代AI基础设施,为AI算力产业困局提供新解法。

DeepSeek走红之后,企业对DeepSeek-R1的需求暴增,但囿于技术能力无法部署运行大模型。在这种情况下,一体机成为了不少人的选择,但鱼龙混杂的一体机,仅能当作“体验装”,还是不能完全释放纯血版模型性能。

超节点是DeepSeek式MoE架构的最优选择。CloudMatrix 384的“MOE亲和”属性,完美适配了模型部署需求。黄瑾指出,对比一卡多专家的“小作坊模式”,超节点更像“大工厂模式”,通过高速互联总线,能够实现一卡一专家高效分布式推理,单卡的MoE计算和通信效率都大幅提升。打个比方,MoE模型就像一个“超级团队”,每个成员(专家)只擅长解决特定问题。但团队合作需要高效沟通和分工,否则就会乱套,而华为云超节点技术就是解决问题的智能指挥中心。

企业对大模型的需求大致可以分为两类,一类是自主研发训练大模型的公司,另一类是有调用大模型需求的公司。

前者,对大模型训练的速度、稳定性和所能提供的算力额度有极高的要求。CloudMatrix 384的以存强算、以网强算和长稳可靠的性能得以凸显。

上述三个功能贯穿大模型训练的初、中、后期。

初期数据预处理和训练阶段,华为云首创了EMS弹性内存存储,“以存强算”即通过存储优化释放算力潜力,解决数据加载瓶颈和显存限制。可以把大模型看作一个人的大脑,脑容量是有限的。如果每次考试前都要补充学习新知识,考试中要把脑子里所有知识检索一遍,十分浪费时间。华为云的做法是开卷考试,提前告诉学生答案,遇到问题直接抄,并且不断给大脑减负,把大部分的东西都变成“已知”。

“以网强算”多用于模型的分布式训练。当AI算力走向规模化部署,单点的芯片性能不再是制约算力发展的唯一变量。CloudMatrix 384通过MatrixLink服务将单层网络升级为两层高速网络,由点及面地激活算力矩阵的共振效应,核心就一个字“快”。这里面有两种思路:超节点的内部,类似于城市里的高架桥,避开拥堵的红灯和行人,可以快速通过,超节点内卡间时延可降至纳秒级;外部,则像连接城市与城市间的高速公路,也是主打速度快,超节点间网络时延达微秒级。

“长稳可靠”在容灾阶段极其关键。该功能就像故障自愈的“AI医生”,可以随时检查“病症”,进行自我修复。对此,华为云开发了昇腾云脑运维“1-3-10”标准,可将硬件故障感知率从40%提升至90%,同时全栈故障知识库能够覆盖95%常见问题,大大缩短了网络故障诊断时效。配合“三层快恢技术”,实现万卡集群故障快速恢复。

第二类有云上调用大模型需求的公司,又可细分为构建AI应用的企业和落地垂类场景的公司。他们或许没有从零到一训练大模型的需求,但对便捷、价格上普遍敏感。

目前,超节点可通过华为云三大算力枢纽覆盖全国19大城市群。自建AI集群往往需要3个月,运维难度也很高,而接入昇腾AI云服务,算力“即开即用”,还能免运维,直接享受云上最新AI算力,大大提高效率、降低成本。

在落地行业场景上,CloudMatrix 384利用“朝推夜训”弹性调度模式为企业“省钱”。其通过“训推共池”“灵活调度”两大关键技术,白天进行模型推理,晚上闲时进行模型训练,24小时高效运转,算力资源利用率可提升30%以上。

从AI基础架构升级到云服务落地场景,“人工智能,就找华为云”不再只是个口号。广告屏的画面传达出一种“劈波斩浪”的气势,暗指在被封禁的困局中找寻破题之法,也传达出华为坚持自主创新的决心。

科技角逐,是一场马拉松

于一项前沿技术而言,先进性固然重要,但最终的衡量标准还是要服务于产业发展,创造出社会价值。

在日益复杂的国际环境之下,CloudMatrix 384超节点的诞生,为国内企业提供了除英伟达之外的第二选择,这将大大缓解企业未来发展的焦虑。特别是对有算力采购需求的央国企来说,安全性和稳定性是压倒性优势,华为的国产算力犹如一颗“定心丸”,让其放开手脚开展数智化改革。

华为是国产自主创新的一个缩影,我们能看到中国企业不止在单点技术和算力方向进行突破,而且正在走向全方位的系统性升级。

正如华为云张平安所言:“当单点技术被封锁时,全栈协同与规模优势将成为破局关键”。

这意味着技术不再是一锤子买卖,而是一项长久性生态系统工程。例如,华为已经实现从硬件到算法的全链路可控,以此来避免对美国CUDA生态的依赖。当下,中国科技企业不仅要上桌,更要掌握行业的话语权,成为制定规则的一方。CloudMatrix 384的价值已超越单纯算力供给,其本质是以系统级创新重构AI竞争维度。

基于CloudMatrix的昇腾AI云服务,正在带着最新的技术成果,飞入千行百业当中。

目前,昇腾AI云服务已覆盖了算力服务、全流程数据治理解决方案,到大模型服务、AI工具链在内的全栈解决方案。在华为云打造的“AI黑土地”上,企业们能够跨越门槛,以最高的效率和最低的成本,“播种”AI创新。

黄瑾介绍,昇腾AI云服务现已全面适配了DeepSeek在内的160多个大模型,以云服务的方式,协助客户进行模型的开发,训练,托管和应用。昇腾AI云服务上线以来,面向政府、金融、零售、互联网、交通、制造等行业已经服务六百多家创新先锋企业。

中美关税之战短暂休庭,但两国间的科技竞争还在继续。科技博弈是场马拉松长跑,得益于中国走自主创新道路,目前已经涌现出了很多成果。

技术上,DeepSeek是中国AI的“逆袭时刻”,以极致的训练效率和性价比,成功复刻OpenAI o1的性能,打开了闭源的“黑匣子”。近几年,具身智能呼声上涨,宇树科技凭借春晚火了一把,“原地后空翻”“单腿关节自由控制”“扭秧歌”等动作,都离不开背后自适应步态生成技术。

从“AI六小虎”到“杭州六小龙”,中国对科技创业的热情前所未有地高涨。相关数据显示,去年人工智能行业融资总额超过1000亿元,其中一半的AI公司在成立三年内拿到了投资。

科技角逐也需要有人来保驾护航,CloudMatrix 384则是华为云给出的答案,助力中国未来AI产业走得更加扎实稳健。

在这场科技博弈下,先发不是绝对优势,靠的是水滴石穿的恒心和攻克难关的勇气。在此基础上,后来者也能居上。在全球科技竞争新格局下,CloudMatrix 384超节点对于AI行业和算力产业将带来新的变量。

来源:光子星球

相关推荐