追求模型效率极限,或是中国大模型的商业化答案
“中国大模型商业化之路,效率驱动新篇。” 在人工智能领域,中国大模型如何突破困境实现商业化?DeepSeek - v3 模型的出现又带来了哪些启示?
“中国大模型商业化之路,效率驱动新篇。” 在人工智能领域,中国大模型如何突破困境实现商业化?DeepSeek - v3 模型的出现又带来了哪些启示?
人工智能基础设施的数据难以精确获取。诸多报道中会出现诸如 “某公司本季度在基础设施上花费了 Xbn”“某公司购买了 10 万台 H100” 或者 “拥有 10 万台 H100 集群” 这类信息,但当笔者试图估算某家公司能够使用的计算资源时,却无法找到统一的数据
最近,LessWrong网站上发表了一篇博客,根据公开数据对英伟达芯片的产量、各个AI巨头的GPU/TPU数量进行了估计,并展望了芯片的未来。