R&D-Agent-Quant：面向量化投研的多智能体框架

摘要：量化投资正迎来由人工走向智能的深刻变革。随着大语言模型（LLMs）与多智能体系统在金融研究中的快速发展，如何让 AI 真正融入量化投研流程、实现从假设生成到策略回测的全链路自动化，成为学术界与产业界共同关注的前沿问题。

量化投资正迎来由人工走向智能的深刻变革。随着大语言模型（LLMs）与多智能体系统在金融研究中的快速发展，如何让 AI 真正融入量化投研流程、实现从假设生成到策略回测的全链路自动化，成为学术界与产业界共同关注的前沿问题。

继开源通用自动化研发框架 R&D-Agent 之后，微软亚洲研究院进一步推出面向量化金融领域的专项版本 R&D-Agent-Quant（R&D-Agent(Q)）。它以“用 AI 驱动 AI”为核心理念，构建数据驱动的智能量化研发体系，在因子挖掘、模型创新与协同优化方面实现突破，为智能化量化研究提供了新的技术方向。详细描述相关技术细节的研究论文现已被 NeurIPS 2025 接收，所有相关的代码实现也已完整开源在 GitHub 上的 R&D-Agent 项目中。

在金融市场这一高维、非平稳且充满不确定性的复杂系统中，如何让大语言模型（LLMs）与多智能体系统真正融入量化投研流程，并在确保可解释性与可复现性的同时，持续产出稳健的超额收益，一直是业界与学界关注的重要问题。

近年来，量化投资正经历从“经验驱动”向“数据驱动”的加速转型。得益于包括微软亚洲研究院 Qlib 在内的开源基础设施，数据处理与回测效率显著提升，使研究重心逐渐回归至量化策略的两大核心：因子挖掘与模型创新。

然而，金融市场的高维度、非平稳性与强波动，仍使传统工作流高度依赖人工，策略迭代缓慢且易受主观偏见影响。与此同时，尽管越来越多的 LLMs 与多智能体系统被引入金融研究，但不少方法直接以自然语言生成交易信号，这不仅额外引入了由大语言模型带来的决策随机性，还缺乏可验证的因子构建与模型逻辑，难以满足实盘应用中的确定性、可解释性与风控要求。

图1：自动化量化投资流程

在这一背景下，微软亚洲研究院继2024年开源的通用自动化研发工具 R&D-Agent 之后，进一步推出了面向量化金融领域的专项版本 R&D-Agent-Quant，简称 R&D-Agent(Q)。该系统以面向数据驱动的理念设计了多智能体框架，并围绕因子挖掘与模型创新的联合优化，打通了“假设生成—代码实现—真实回测—反馈分析”的全栈自动化闭环，向“用 AI 驱动 AI”的智能化量化工厂迈出关键一步。相关论文已被 NeurIPS 2025 接收，代码也已在 GitHub 上开源。

R&D-Agent / R&D-Agent(Q) GitHub 链接：

R&D-Agent-Quant 论文链接：

五大功能单元与两大场景，让量化 R&D 更智能

量化研发面临的主要挑战有三个。首先，自动化不足使得从假设生成、编码实现到调参都依赖大量人工，不仅迭代慢且易引入偏差。其次，最新基于 LLMs 的端到端方案虽自动化程度高，但确定性及可解释性弱。部分基于 LLMs 的方法直接由文本生成交易信号，缺少可落地的因子构建与模型结构，难以支撑实盘要求。第三，优化流程割裂。在传统的工作流中，数据处理、因子挖掘、模型训练与评估通常分散执行，缺少跨阶段协同与反馈融合，从而制约了整体优化的效果与效率。

针对上述问题，R&D-Agent(Q) 将量化研发过程拆解为两个阶段——探索（Research）与开发（Development），并细化为五个功能单元。这些单元在统一接口下循环迭代、逐步进化，构成了完整的智能化研发闭环。

规范单元（Specification Unit）：在理论与工程两个维度统一上下文与约束，并标准化数据接口、输出格式与回测环境（例如基于 Qlib 的回测），以降低歧义，保障结果的可复用性。构思单元（Synthesis Unit）：基于历史实验与领域知识，自动生成新假设并映射为可执行任务。通过“想法森林”机制在“探索”与“开发”之间实现自适应平衡，为因子或模型提供可落地的创新路径。实现单元（Implementation Unit）：内置面向数据中心任务的代码智能体 Co-STEER。通过任务依赖 DAG、引导式推理与可迁移知识库，支持复杂任务的正确实现与高效修复，从而大幅提升开发的成功率。验证单元（Validation Unit）：统一因子与模型的评测流程。对新因子先行去重（与现有最优因子库计算相似性，仅保留与现有因子都不相似的强因子），再与当前最优模型组合进行真实回测；模型评测则相应地与当前最优因子库组合评测。分析单元（Analysis Unit）：对每轮实验进行多维诊断，更新最优集合，并生成有针对性的优化建议。系统内置基于线性 Thompson 采样的上下文多臂老虎机调度器，能够自适应决定下一轮优先优化“因子”还是“模型”，在有限算力下最大化整体增益。

图2：R&D-Agent(Q) 框架

基于上述设计理念，R&D-Agent(Q) 已经展现出多个面向量化研究的典型应用能力。它能够自动化构建“因子工厂”，从文献、报告知识与历史反馈中生成、筛选、组合新因子，进行自动去重与有效性校验。它还可以在统一规格下自动构造可解释的模型结构与训练推断流程，并进行回测与风险评估。此外，通过因子–模型联合优化机制，R&D-Agent(Q) 能够动态调整优化方向，在预测准确率与策略稳健性之间取得更好的平衡。

图3：R&D-Agent(Q) 流程图

R&D-Agent(Q) 这一系列功能背后，凝聚了多项关键技术创新。

端到端自动化与可解释性：系统在统一的输入输出协议下，假设、代码与回测结果全流程留痕，降低了幻觉风险。Co-STEER 开发智能体：面向数据中心任务的代码生成与修复，利用 DAG 依赖排序、可迁移知识库与迭代反馈，提升了代码生成的准确度，使复杂任务也能快速收敛。因子–模型协同优化：验证单元提供对称评估，分析单元以多臂老虎机自适应决策优化方向，实现了探索–利用的动态平衡，在有限算力下获得最优收益。真实可复现的评测与落地：系统集成了 Qlib 回测环境、统一因子预测指标（IC、ICIR、Rank IC 等）与策略指标（ARR、IR、MDD、Calmar 等），确保评测过程真实可复现、结果可对比，强化了整体工程的可信度。

实证结果

在基于 A 股沪深300数据集的实验中，R&D-Agent(Q) 展现出了在效率、稳健性与收益表现方面的显著优势。

在仅优化因子维度的实验中，R&D-Factor 在固定模型的条件下，通过动态筛选与去冗余机制，实现了更高效的因子管理。与传统因子库相比，它使用的因子数量减少了70%以上，但同时提升了信息系数（IC）和年化收益率（ARR），证明了 R&D-Agent(Q) 在因子挖掘与筛选环节的智能化效果。