摘要:前些时间,在DeepSeek-V3.1正式发布同时,也透露了DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,而UE8M0 FP8 是针对即将发布的下一代国产芯片设计。
前些时间,在DeepSeek-V3.1正式发布同时,也透露了DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,而UE8M0 FP8 是针对即将发布的下一代国产芯片设计。
与此同时,这些工信部也在倡导加快国产GPU芯片实现新突破。
从DeepSeek提前爆料国产GPU可能的进展,到部位鼓励加快国产GPU的突破,从中可以看出,国产GPU可能正在憋大招。不知道你认同不?
在阿明看来,国产GPU品牌厂商正朝着自主创新、性能提升和生态建设的方向努力。龙芯、砺算等企业在通用GPU领域不断突破,而华为、寒武纪等则在AI加速芯片领域表现突出。虽然目前整体与国际顶尖水平有差距,但发展势头强劲,在一些特定场景和应用中已能发挥作用。
那么,谁会抢先实现新突破呢?
国产GPU厂商简要掠影:
龙芯中科: 产品9A1000,首款自研GPGPU,FP32算力1TFLOPS,支持PCIe 4.0、OpenCL 3.0 入门级图形处理、AI加速、边缘计算。
砺算科技:产品7G100系列, 6nm工艺,自研TrueGPU天图架构,支持FP32/FP16/INT8多精度运算,性能宣称超越RTX 4060,覆盖个人电脑、专业设计、AI PC、云游戏、云渲染、数字孪生等应用。
华为:产品昇腾系列,昇腾910算力达256TFLOPS(FP16),覆盖高性能计算、AI训练与推理领域。
海光信息:产品DCU系列,性能接近NVIDIA A100,兼容ROCM生态,覆盖AI服务器、高性能计算应用。
寒武纪:产品MLU系列,5nm MLU5系列芯片性能对标NVIDIA A100,覆盖AI训练与推理、云边端全场景。
摩尔线程:产品MTT系列,强调全功能GPU定位,基于自主MUSA架构,实现了单芯片架构同时支持AI计算加速、图形渲染、物理仿真、超高清视频编解码等,满足多元化加速需求。
天数智芯:产品天垓100,专注于GPGPU芯片高性能计算系统,通用GPU天垓100芯片及天垓100加速卡实现量产,7nm制程,已经获得规模应用。
沐曦:产品曦云C500,定位通用GPU芯片,性能接近国际水平,强调训推一体机、通用计算。
燧原科技:产品云燧T10/T11,支持大规模集群计算,采用存算一体技术,其中聚焦AI训练为T10/T11,聚焦推理为I10。
昆仑芯:产品昆仑芯R200,配合百度飞桨平台,通用性和性能还可以。聚焦人工智能应用及各类算法适配。
此外,还有热心网友补充:壁仞科技\景嘉微\阵量\中昊芯英\象帝先\瀚博等,也值得关注。
- END-
你怎么看?
欢迎文末评论补充!
【科技明说|全球云观察|全球存储观察 |阿明观察】专注科技公司分析,用数据说话,带你看懂科技。本文和作者回复仅代表个人观点,不构成任何投资建议。
来源:阿明观察