optimization

阿里QwenLong-L1-32B：长文本推理新突破，强化学习训练显神威

阿里通义千问Qwen团队近日正式推出了其最新研发成果——QwenLong-L1-32B模型，这一模型在长文本情境推理领域实现了新的突破。据团队介绍，QwenLong-L1-32B是首个通过强化学习训练的长文本情境推理模型（LRM），其性能在多个基准测试中表现优

本期对《运筹与管理》一本高影响力期刊进行论文目录整理汇总。【期刊卷期信息】/【Volume and Issue】一、《运筹与管理》Volume 33, Issue 9, September 2024二、《运筹与管理》Volume 33, Issue 10, O