摘要:以DeepSeek为典型代表的新一轮大模型的爆发,引发了大家对AI算力基础设施的争论热潮。从民间到政府,包括业界各利益相关甚至无关方,各种声音层出不穷,争得不可开交。有说DeepSeek底层跳过CUDA,英伟达生态护城河即将崩塌的;有说DeepSeek彻底减少
以DeepSeek为典型代表的新一轮大模型的爆发,引发了大家对AI算力基础设施的争论热潮。从民间到政府,包括业界各利益相关甚至无关方,各种声音层出不穷,争得不可开交。有说DeepSeek底层跳过CUDA,英伟达生态护城河即将崩塌的;有说DeepSeek彻底减少了对训练算力的需求,以后大型智算集群不要建了的;还有说模型推理算力服务(包括DeepSeek本身)都是赔本赚吆喝的;等等论点,层出不穷,眼花缭乱,让人无所适从。为了将背后的原理、趋势、影响论个明白,正本清源,帮助业界参与方和政府决策部门走出一条正确的AI Infra发展之路,CCF规划了“AI算力基础设施走向何方?”的系列论坛。而作为系列论坛的开山之作,CCF YOCSEF AC、国家超级计算长沙中心常务副主任、湖南大学教授陈果,CCF YOCSEF AC副主席、智谱华章联合创始人、首席架构师鄢兴雨,于5月23日下午,借2025CCF青年精英大会(YEF2025)于珠海市召开之机,共同主持举办了题为“DeepSeek东风起,AI算力摆脱英伟达的时机到了吗?”的专题论坛。
本次专题论坛有幸邀请了清华大学教授翟季冬、北京并行科技董事长陈健、沐曦联合创始人、CTO兼首席软件架构师杨建、YOCSEF长沙AC主席纪军刚等专家做了技术报告。论坛设置专题讨论环节,除技术报告嘉宾参与讨论外,另邀请了海光信息科研行业首席技术官鲁恬舒,同与会全体嘉宾围绕“国产AI算力与英伟达的差距有没有、有哪些、有多大?”、“现阶段该如何用好国产AI算力?用到哪、怎么用?”、“下阶段国产AI算力该如何发展?”等思辨议题进行了深入而直率地讨论,线上线下均反响热烈。
论坛执行主席陈果、鄢兴雨做论坛简介报告
论坛开始,首先由陈果介绍了论坛的背景。当前全球AI算力竞争已进入关键阶段。中国算力总规模接近全球三分之一,但高端训练芯片仍依赖英伟达。近年来供应链风险持续提高,迫使国产芯片加速替代进程。这一持续了数年的艰难长征,随着以DeepSeek为代表的的国产推理大模型横空出世,火热的市场需求为国产算力“软硬协同突破”提供了新的契机。当前国产AI算力面临以性能差距、生态碎片化、政策与市场错配为代表的三重挑战。因此,为推动技术突围和生态重构,本次论坛邀请了产学研领袖,聚焦性能对标、算力稳定性优化、生态整合路径、生态战略选择、政策协同机制等五大方面的核心议题,旨在为中国AI算力突破困局提供技术路线与行动共识,助力国产芯片在算力需求机遇期实现弯道超车。
杨建报告
在报告环节,杨建从芯片供应方的视角,发表了题为《优质算力+开源生态实现智能算力普惠》的演说。他指出,Deepseek开源迎来了大模型的平权时代,在后大模型时代我们需要足够的优质算力+海量开源软件栈+大模型开发者。在优质算力方面,因英伟达供应的限制,以Deepseek为代表的国产大模型参数量相对ChatGPT较少,沐曦全力研发全栈GPU芯片产品,截止2024年底落地算力集群总规模超万卡,力图作为国产优质算力的代表在未来努力填补市场空缺。此外,在海量开源软件栈和大模型开发者方面,沐曦基于MACA共建开放的人工智能的开源计算生态,联合“产学研用投”,构建开源、开放的AI Infra开源社区,并提供大量免费GPU算力和课程内容,以培养百万规模MACA生态开发、大模型开发者,绘制未来宏伟发展蓝图。
翟季冬报告
翟季冬从国产算力生态的角度,发表了题为《面向国产智能算力核心基础软件》的演说。翟季冬指出,国内市场的算力风向已从关注训练转移到推理,当前限制国产智能算力发展的核心问题还是在于软件生态。清华大学团队基于可扩展并行+智能编译器双向突破的研发路径,在国产神威超算平台开发部署了智能算力核心基础软件“八卦炉”这一支撑国产AI算力的基础软件集,涵盖了并形成、计算层与底层系统,实现了百万亿参数预训练模型加速,支撑了跨尺度大气预测模型swMPAS-A、第一性原理大模型乾坤Net等多个AI for Science应用程序。此外,“八卦炉”对基于沐曦、壁仞、天数的国产智算集群均进行了优化,性能提升显著,且支持不同厂商GPU的高效混合训练。在推理方面,清华大学团队也推出了大模型推理引擎“赤兔”,相较vLLM,性能具有显著优势,且已支持沐曦等国产芯片。
陈健报告
陈健从算力服务供应方及算网运营方的视角,发表了题为《基于用户视角的国产算力服务现状和未来》的演说。陈健指出,在智算芯片的生态适配工作中,英伟达有一定的先发优势,占据着基础生态优势,其生态适配工作量目前相对较低。更值得关注的是,以华为昇腾、海光为代表的国产头部厂商正快速崛起,通过技术攻坚实现了关键突破,技术代差迅速缩小,已与英伟达形成并驾齐驱之势,整体性能表现已跻身国际顶尖水平行列。从产业发展阶段看,国产GPU行业正处于从起步探索向规模化应用跃升的关键节点。目前,除少量头部品牌已实现场景落地,若想要推动国产算力进一步发展,仍需突破多重挑战。比如需要解决自研自主可控的IP问题,实现与国产CPU的同频共振及控制调用;需要突破产能与制程瓶颈;在这个发展过程中进一步丰富应用生态,通过海量的真实业务场景验证产品性能,从而赢得行业用户的认可与信任。在这一点上,我们整个行业必须一起努力,形成合力。此外,陈健特别分享了某客户从英伟达 N 卡切换至昇腾平台的成功案例。数据显示,昇腾平台在训练精度上与N卡对齐,ModelLink精度可媲美torch原生框架,在推理服务环节亦展现出卓越的支持能力,为国产算力的应用实践提供了有力参考。
纪军刚报告
纪军刚从终端用户的视角,发表了题为《科技突围:探寻“谁是国产英伟达?”》的报告。报告指出,新一代人工智能快速发展,算力需求快速增长,算力和算力基础设施的发展质量已成为影响国家竞争力的关键因素之一。美国先后限制各型号高端芯片出口中国,使中国在人工智能领域发展面临重大挑战。为拨云见日发现可能的突围者,纪军刚详细对比了英伟达6款加速卡与8款国产加速卡的官方参数与实测参数。此外,纪军刚提到,海光是国内唯一同时拥有信创CPU和DCU(GPGPU)的IC设计公司,海光三号预计将于2025年量产,7nm新品关键指标将对标英伟达A100,有望较好地适配、适应国际主流商业计算软件和人工智能软件。
在引导报告之后,陈果、鄢兴雨,会同翟季冬、陈健、杨建、纪军刚、鲁恬舒等嘉宾共同开启了接下来的思辨环节。与会嘉宾围绕“国产AI算力与英伟达的差距有没有、有哪些、有多大?”、“现阶段该如何用好国产AI算力?用到哪、怎么用?”、“下阶段国产AI算力该如何发展?”等三个主要议题,展开了深入思辨。同时,论坛助理引述精彩的观点在论坛微信群内实时进行了文字直播,引发了线上的热烈讨论,部分微信群内的观点也同样为论坛提供了重要参考。
思辨现场与线上讨论
在关于“议题一:国产AI算力与英伟达的差距有没有、有哪些、有多大?”的讨论中,主持人首先总结了报告阶段的嘉宾观点:在单芯片运算速度方面国产AI算力有明显差距,且对FP8等多精度支持能力有限;在多芯片互联方面机内(NVLink)、机间(RDMA)互联英伟达同样具有明显领先优势。不仅性能,在生态差距上,CUDA无论从技术角度还是市场角度均优势明显,构建优秀的国产生态并培养足够的开发者,进而取代CUDA,任重而道远。然而,现场嘉宾同样认为,国产算力已具备一定的可用性,在面临英伟达的芯片禁运时,国产生态已具备完整的从基础设施到应用服务的全流程替代能力,且部分厂商产品在为数不少的应用场景下即使不考虑政府补贴,也已具备一定的市场竞争力。部分嘉宾相信,随着先进制程产能的突破和更多开发者的参与,国产AI算力在性能和生态上追平英伟达未来可期。
在关于“议题二:现阶段该如何用好国产AI算力?用到哪、怎么用?”的讨论中,产业实践中的现实困境引发热议。现场观众指出,当前国产信创产品受限于性价比瓶颈导致应用场景收窄。技术层面分析显示:虽然多家国家超级计算中心依托专项资金已实现国产计算基础设施规模化部署多年,但商业化市场仍面临双重考验——芯片厂商需在提升异构兼容性的同时优化综合拥有成本。尽管头部企业正通过"算力+数据库+框架"的全栈方案布局长期价值,但受限于市场付费意愿低迷,现阶段实际收益仍依赖用户行为数据的潜在价值挖掘。这种商业闭环的未成熟性,叠加多数厂商面临的现金流压力,导致技术服务体系难以全面覆盖中小客户群体。对此,多位专家强调,对于大部分国产GPU厂商,突围路径可能存在于专用芯片领域:相较于通用GPU赛道,聚焦ASIC架构发挥软硬协同优势,更有可能构建出差异化的竞争力。尽管如此,产业曙光已然显现:以并行科技为代表的平台企业通过高校免费算力配额等创新模式培育生态:从开发者社区的早期认可,到行业解决方案的标杆突破,最终实现商业价值的规模化兑现,这个螺旋上升过程可能需要3-5年的耐心耕耘。本议题的讨论兼具了现实考量与发展预期,为产业界理解国产AI算力演进路径提供了多维坐标。
在关于“议题三:下阶段国产AI算力该如何发展?”的讨论中,部分嘉宾表示,近年来已有部分厂商如华为、海光、并行科技在相关领域的业务开始盈利。现场嘉宾一致认为,对于国产智算芯片的性能和市场占有率的提升,最大的限制仍是光刻机,各厂商对于先进制程产能的争夺决定了生死。此外,我国高校对于国产AI算力人才及国产AI基础设施使用习惯的培养也迫在眉睫,现场教育界人士均认为国家应加大投资力度,从年轻人抓起,鼓励和培养一大批惯用国产生态的开发者,不仅能扩大国产生态的影响力,也有助于降低企业的人力成本。
论坛参与人员合影
经过近四个小时的精彩报告和热烈讨论,论坛执行主席陈果最后总结道,现阶段国产AI算力虽与英伟达相比仍有差距,但在部分应用场景下已具备一定的可用性。随着今年以来推理需求的大幅提升,国产算力厂商有了更大的发展机会,未来数年其市场认可度、相关生态的开发人员数量等均有望大幅提升,部分头部厂商有机会迫近、追平英伟达。对此,国家应当持续追加相关领域的教育投资,不仅可以完成人才的培养,也为相关厂商提供了技术储备与未来发展的基石。
系列论坛“AI算力基础设施走向何方?”的首秀—技术论坛“DeepSeek东风起,AI算力摆脱英伟达的时机到了吗?”已落下帷幕,敬请期待后续两场论坛在相关领域持续带来学术盛宴,激起更深的思维浪花!
来源:CCFvoice