摘要:“风华1号”,2021年问世,是中国第一款能用于数据中心的4K级别智能渲染GPU。单精度浮点算力是5TFLOPS,用两颗“风华1号”芯片做出来的显卡,性能可以对标英伟达的T4。显存方面,它用了当时很先进的GDDR6/GDDR6X技术,最大容量16GB。
刚刚,芯动科技发布了“风华3号”,单卡直接堆上了112GB以上的超大显存。
“风华3号”是芯动科技“风华”这个GPU家族的最新成员。在它之前,还有两位兄长探过路。
“风华1号”,2021年问世,是中国第一款能用于数据中心的4K级别智能渲染GPU。单精度浮点算力是5TFLOPS,用两颗“风华1号”芯片做出来的显卡,性能可以对标英伟达的T4。显存方面,它用了当时很先进的GDDR6/GDDR6X技术,最大容量16GB。
“风华2号”,2022年登场,主攻桌面市场。它是国内第一款能支持4K三屏显示的高清桌面GPU,性能大概和英伟达的GTX 1050差不多。别小看这个性能,对于很多办公和国产化替代场景来说,已经相当够用。
9月22日,芯动科技在珠海正式发布了“风华3号”全功能GPU。
很多用于服务器的GPU,其实是GPGPU(通用计算图形处理器),阉割了图形和显示功能。而全功能GPU,计算、图形渲染、视频编解码、多屏显示这些活儿全都能干,架构更复杂,门槛自然也更高。
它有六个特别亮眼的地方。
国内首款把国产RISC-V(一种开放指令集架构)CPU和兼容CUDA的GPU集成在一起的芯片。
全球第一款原生支持DICOM(医学数字成像和通信)高精度灰阶显示的GPU。
国内第一款单卡配备112GB以上大显存,并且核心IP全自研的全功能GPU。
国内第一款支持光线追踪的8K渲染GPU。
国内第一款支持YUV444无损编码的GPU。
打通了“计算+存储+连接”,构建了国产GPU的第一个完整生态。芯动科技不只发布了GPU,还展示了自家的高端DDR5内存模组和PCIe5服务器交换芯片。
它的FP32性能达到了78 TFLOPS,这个算力足以应对大模型训练和复杂的科学计算。
显存配置是112GB以上的高带宽显存。这让它单卡就能跑得动320亿或720亿参数的大模型;如果一台服务器装上八张卡,更是能直接驱动像DeepSeek 671B/685B这种级别的巨型模型。
渲染方面,它支持8K分辨率下的光线追踪,兼容DirectX12等主流图形接口。在运行CAD工业软件时,性能达到了国际主流水平,玩《古墓丽影》这样的3A游戏也不在话下。
显示和编码能力上,一张卡可以同时带动6个8K分辨率的屏幕,并且支持前面提到的YUV444无损编码。
生态兼容性上,它支持PyTorch、CUDA、Triton等主流AI计算生态,也支持DirectX、OpenGL、Vulkan等渲染生态,还能适配国内外各种操作系统。
国产GPU正在奋起直追,路越走越宽了。
参考资料:
来源:算泥社区