超越80/20法则:少数高熵词决定了大模型推理能力的提升 大模型的推理能力在近年来取得了显著进步,但这些进步背后的机制我们却知之甚少。来自阿里巴巴Qwen团队和清华大学LeapLab的研究人员在2025年6月的最新研究中,通过探索一个全新视角——词元(token)熵模式,揭示了强化学习在提升大模型推理能力过程中的工作 模型 推理 aime 熵值 低熵 2025-06-05 23:44 4