SmolLM2技术突破:多阶段训练与优质数据集驱动小模型性能飞跃 在挑战大型语言模型(LLM)性能边界的征程中,SmolLM2以仅1.7B参数的创新架构,通过四阶段精细化训练策略与多领域优质数据集的协同优化,在MMLU-Pro等基准测试中超越Qwen2.5-1.5B近6个百分点,数学推理(GSM8K、MATH)、代码生成及长 训练 模型 数据集 smollm2 smollm2技术 2025-03-22 14:08 2