MoE 中的 Expert 是你理解的“专家”吗?
在最近的面试过程中,几乎没有几个候选人能真正理解MoE,尤其对Expert 的理解几乎没人能回答对,但是MoE 在当前的大模型结构中被广泛的应用,如DeepSeek-V 系列,DeepSeek-R1 ,Qwen-1.5-MoE 等。
路由 moe token expert transforme 2025-03-10 14:08 3
在最近的面试过程中,几乎没有几个候选人能真正理解MoE,尤其对Expert 的理解几乎没人能回答对,但是MoE 在当前的大模型结构中被广泛的应用,如DeepSeek-V 系列,DeepSeek-R1 ,Qwen-1.5-MoE 等。
路由 moe token expert transforme 2025-03-10 14:08 3
先来说说那些觉得中国AI“动弹不得”的观点。有人觉得,DeepSeek这么厉害,把市场的注意力和资源都吸引过去了,其他中国AI企业还怎么发展?还有人担心,美国看中国AI有DeepSeek这样的“出头鸟”,肯定会变本加厉地打压,到时候大家都得跟着遭殃。这想法,简
deepseek deepseek搅局 transforme 2025-02-04 07:31 3