qwen团队

阿里QwenLong-L1-32B：长文本推理新突破，强化学习训练显神威

阿里通义千问Qwen团队近日正式推出了其最新研发成果——QwenLong-L1-32B模型，这一模型在长文本情境推理领域实现了新的突破。据团队介绍，QwenLong-L1-32B是首个通过强化学习训练的长文本情境推理模型（LRM），其性能在多个基准测试中表现优