从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。 kimi llm 架构 llama llm主流 2025-08-07 18:02 2