mla

把MLA和稀疏激活带到端侧!港科大广州等联合发布边缘语言模型PLM

本文由 PLM 团队撰写,PLM 团队是由香港科技大学(广州)的校长倪明选教授,伦敦大学学院(UCL)AI 中心汪军教授,香港科技大学(广州)信息枢纽院长陈雷教授联合指导。第一作者邓程是香港科技大学(广州)的研究助理,研究方向为端侧大模型和高效模型推理;参与成

模型 plm mla 港科大广州 模型plm 2025-03-27 16:21  1

极氪领克的智驾不仅要成为第一梯队

极氪此前已经发誓,在新能源这个领域(整车综合技术指标),要成为世界的标杆。现在在智驾领域也要成为标杆,没说是世界,但起码是国内。国外除了特斯拉,还有啥能谈智驾的?就现在国内特斯拉刚推送的FSD这智驾水平,目前还不能完全说服国人,当然,它需要时间,需要走一条符合

算法 领克 l4 mla 安聪慧 2025-03-01 14:26  3

DeepSeek今日启动开源周:公布首个开源代码库Flash MLA

与传统解码器相比,Flash MLA在处理可变长度序列时,能够显著提高计算效率和速度。这对于自然语言处理、图像识别、语音识别等需要大规模数据处理的应用场景具有重要意义,可以加速模型训练和推理过程,提升AI应用的性能和效率。

开源 flash mla 2025-02-24 19:35  5

DeepSeek突发!本周启动!

2月24日,DeepSeek开源了首个代码库FlashMLA。据了解,这是DeepSeek针对Hopper GPU优化的高效MLA(Multi-Head Latent Attention,多头潜在注意力)解码内核,专为处理可变长度序列而设计,现在已经投入生产使

突发 deepseek mla 2025-02-24 22:35  5

当我们谈论DeepSeek时,是在谈论什么

“中国AI和美国有一两年差距,但真实的gap是原创和模仿之差”“过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里” “经验包袱太重的人,创新动力不足”……他的话语朴实且坦诚,道理讲得很白,却给人耳目一新之感。这一点,与大家在使用DeepSeek时的感

deepseek moe mla 2025-02-07 08:51  5

Deepseek正重塑原有AI市场格局

在2025年春节阖家欢聚的氛围中,AI领域一匹“黑马”深度求索(Deepseek)火遍大江南北。这家中国企业携创新产品强势出圈,在全球范围引发关注热潮,其影响从技术前沿渗透到资本市场,不仅带动港股、美股相关概念股大幅波动,还促使国际科技巨头紧急调整战略。

英伟达 deepseek mla 2025-02-07 08:21  7