7B模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM 这个方法要求教师模型像优秀的人类教师一样,根据已知解决方案输出清晰的逐步解释,而不再是从头开始自己解决。 模型 教师 推理 llm 推理llm 2025-06-25 14:13 2