DeepSeek-V3.2-Exp模型发布,利好这几个方向!

B站影视 韩国电影 2025-09-30 05:40 1

摘要:DeepSeekSparseAttention(DSA),针对长文本的训推效率进行了探索性的优化和验证。在测试集表现与V3.1-Terminus相近的情况下,API的成本将降低50%以上,输入(缓存命中)/(缓存未命中)/输出分别定价0.2/2/3元每百万To

9 月 29 日消息,DeepSeek今日正式发布 DeepSeek-V3.2-Exp 模型。

模型亮点:降本50%

DeepSeekSparseAttention(DSA),针对长文本的训推效率进行了探索性的优化和验证。在测试集表现与V3.1-Terminus相近的情况下,API的成本将降低50%以上,输入(缓存命中)/(缓存未命中)/输出分别定价0.2/2/3元每百万Tokens。

长文本效率显著优化

和DeepSeek此前提出的NSA的算法逻辑类似,通过信息预筛选(只处理关键信息)降低注意力计算压力。其核心机制在于闪电索引器(LightningIndexer)用很少的头数(计算量)和FP8低精度实现信息高效筛选,主注意力模块(核心模型)只处理筛选后的重要信息,进而实现长文本性能提升和成本下降。

算力影响:国产芯片与国产模型真正实现相向而行

本次开源的算子包含TileLang与CUDA两种版本,官方建议社区使用基于TileLang的版本以方便调试和快速迭代。

华为宣布昇腾0Day支持DeepSeek-V3.2-Exp,立刻支持FP16部署,在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。

寒武纪Day 0适配DeepSeek-V3.2-Exp,同步开源推理引擎vLLM-MLU

预计后面其他国产芯片龙头也宣布0Day适配并支持TileLang,结合8月21日的UE8M0FP8,国产芯片与国产模型真正实现相向而行

DeepSeek-V3.2-Exp模型正式发布,利好国产算力、AI应用。

DeepSeek概念:每日互动、东珠生态、杭钢股份、青云科技、并行科技、优刻得、拓维信息

国产AI芯片:寒武纪、芯原股份、翱捷科技、海光信息、云天励飞、东芯股份、景嘉微

华为算力:华丰科技、川润股份、华胜天成

AI应用:鼎捷数智、慧辰股份、用友网络、海天瑞声、昆仑万维、卓易信息、万兴科技等

另外,OpenAI将在10月6日于旧金山举行开发者日活动,现场将展示其最新模型和工具。活动安排包含开幕主题演讲,届时OpenAI 计划公布其最新产品信息。

存储方面,近期走势非常强。

据台湾工商时报消息,DRAM及NAND闪存市场都出现缺货,且缺货情况较此前预测更为严峻,预计今年四季度及2026年行业价格将进一步上升。

一方面,由于全球云厂商大幅上调2026年订单,现阶段存储三大原厂(SK海力士、美光、三星)库存已经不足,未来产能或无法满足客户需求。

另一方面,传统HDD大厂相继减产,业内人士认为也可能造成至少半年的供应不足,迫使部分订单转向SSD,进一步加剧NAND供应链紧张。

在这一背景下,全球存储行业多家厂商都相继开启调价。

存储:江波龙、德明利、佰维存储、联芸科技、开普云、兆易创新、普冉股份、东芯股份、聚辰股份、香农芯创

声明:本文只是信息分享,不构成任何投资建议,市场有风险,投资需谨慎。多多点赞支持,感谢。

来源:晋小乐

相关推荐