阿里QwenLong-L1-32B:长文本推理新突破,强化学习训练显神威
阿里通义千问Qwen团队近日正式推出了其最新研发成果——QwenLong-L1-32B模型,这一模型在长文本情境推理领域实现了新的突破。据团队介绍,QwenLong-L1-32B是首个通过强化学习训练的长文本情境推理模型(LRM),其性能在多个基准测试中表现优
训练 学习 推理 optimization qwen团队 2025-05-27 14:37 9
阿里通义千问Qwen团队近日正式推出了其最新研发成果——QwenLong-L1-32B模型,这一模型在长文本情境推理领域实现了新的突破。据团队介绍,QwenLong-L1-32B是首个通过强化学习训练的长文本情境推理模型(LRM),其性能在多个基准测试中表现优
训练 学习 推理 optimization qwen团队 2025-05-27 14:37 9