R&D-Agent-Quant:面向量化投研的多智能体框架

B站影视 日本电影 2025-10-15 17:22 1

摘要:量化投资正迎来由人工走向智能的深刻变革。随着大语言模型(LLMs)与多智能体系统在金融研究中的快速发展,如何让 AI 真正融入量化投研流程、实现从假设生成到策略回测的全链路自动化,成为学术界与产业界共同关注的前沿问题。

量化投资正迎来由人工走向智能的深刻变革。随着大语言模型(LLMs)与多智能体系统在金融研究中的快速发展,如何让 AI 真正融入量化投研流程、实现从假设生成到策略回测的全链路自动化,成为学术界与产业界共同关注的前沿问题。

继开源通用自动化研发框架 R&D-Agent 之后,微软亚洲研究院进一步推出面向量化金融领域的专项版本 R&D-Agent-Quant(R&D-Agent(Q))。它以“用 AI 驱动 AI”为核心理念,构建数据驱动的智能量化研发体系,在因子挖掘、模型创新与协同优化方面实现突破,为智能化量化研究提供了新的技术方向。详细描述相关技术细节的研究论文现已被 NeurIPS 2025 接收,所有相关的代码实现也已完整开源在 GitHub 上的 R&D-Agent 项目中。

在金融市场这一高维、非平稳且充满不确定性的复杂系统中,如何让大语言模型(LLMs)与多智能体系统真正融入量化投研流程,并在确保可解释性与可复现性的同时,持续产出稳健的超额收益,一直是业界与学界关注的重要问题。

近年来,量化投资正经历从“经验驱动”向“数据驱动”的加速转型。得益于包括微软亚洲研究院 Qlib 在内的开源基础设施,数据处理与回测效率显著提升,使研究重心逐渐回归至量化策略的两大核心:因子挖掘与模型创新。

然而,金融市场的高维度、非平稳性与强波动,仍使传统工作流高度依赖人工,策略迭代缓慢且易受主观偏见影响。与此同时,尽管越来越多的 LLMs 与多智能体系统被引入金融研究,但不少方法直接以自然语言生成交易信号,这不仅额外引入了由大语言模型带来的决策随机性,还缺乏可验证的因子构建与模型逻辑,难以满足实盘应用中的确定性、可解释性与风控要求。

图1:自动化量化投资流程

在这一背景下,微软亚洲研究院继2024年开源的通用自动化研发工具 R&D-Agent 之后,进一步推出了面向量化金融领域的专项版本 R&D-Agent-Quant,简称 R&D-Agent(Q)。该系统以面向数据驱动的理念设计了多智能体框架,并围绕因子挖掘与模型创新的联合优化,打通了“假设生成—代码实现—真实回测—反馈分析”的全栈自动化闭环,向“用 AI 驱动 AI”的智能化量化工厂迈出关键一步。相关论文已被 NeurIPS 2025 接收,代码也已在 GitHub 上开源。

R&D-Agent / R&D-Agent(Q) GitHub 链接:

R&D-Agent-Quant 论文链接:

五大功能单元与两大场景,让量化 R&D 更智能

量化研发面临的主要挑战有三个。首先,自动化不足使得从假设生成、编码实现到调参都依赖大量人工,不仅迭代慢且易引入偏差。其次,最新基于 LLMs 的端到端方案虽自动化程度高,但确定性及可解释性弱。部分基于 LLMs 的方法直接由文本生成交易信号,缺少可落地的因子构建与模型结构,难以支撑实盘要求。第三,优化流程割裂。在传统的工作流中,数据处理、因子挖掘、模型训练与评估通常分散执行,缺少跨阶段协同与反馈融合,从而制约了整体优化的效果与效率。

针对上述问题,R&D-Agent(Q) 将量化研发过程拆解为两个阶段——探索(Research)与开发(Development),并细化为五个功能单元。这些单元在统一接口下循环迭代、逐步进化,构成了完整的智能化研发闭环。

规范单元(Specification Unit):在理论与工程两个维度统一上下文与约束,并标准化数据接口、输出格式与回测环境(例如基于 Qlib 的回测),以降低歧义,保障结果的可复用性。构思单元(Synthesis Unit):基于历史实验与领域知识,自动生成新假设并映射为可执行任务。通过“想法森林”机制在“探索”与“开发”之间实现自适应平衡,为因子或模型提供可落地的创新路径。实现单元(Implementation Unit):内置面向数据中心任务的代码智能体 Co-STEER。通过任务依赖 DAG、引导式推理与可迁移知识库,支持复杂任务的正确实现与高效修复,从而大幅提升开发的成功率。验证单元(Validation Unit):统一因子与模型的评测流程。对新因子先行去重(与现有最优因子库计算相似性,仅保留与现有因子都不相似的强因子),再与当前最优模型组合进行真实回测;模型评测则相应地与当前最优因子库组合评测。分析单元(Analysis Unit):对每轮实验进行多维诊断,更新最优集合,并生成有针对性的优化建议。系统内置基于线性 Thompson 采样的上下文多臂老虎机调度器,能够自适应决定下一轮优先优化“因子”还是“模型”,在有限算力下最大化整体增益。

图2:R&D-Agent(Q) 框架

基于上述设计理念,R&D-Agent(Q) 已经展现出多个面向量化研究的典型应用能力。它能够自动化构建“因子工厂”,从文献、报告知识与历史反馈中生成、筛选、组合新因子,进行自动去重与有效性校验。它还可以在统一规格下自动构造可解释的模型结构与训练推断流程,并进行回测与风险评估。此外,通过因子–模型联合优化机制,R&D-Agent(Q) 能够动态调整优化方向,在预测准确率与策略稳健性之间取得更好的平衡。

图3:R&D-Agent(Q) 流程图

R&D-Agent(Q) 这一系列功能背后,凝聚了多项关键技术创新。

端到端自动化与可解释性:系统在统一的输入输出协议下,假设、代码与回测结果全流程留痕,降低了幻觉风险。Co-STEER 开发智能体:面向数据中心任务的代码生成与修复,利用 DAG 依赖排序、可迁移知识库与迭代反馈,提升了代码生成的准确度,使复杂任务也能快速收敛。因子–模型协同优化:验证单元提供对称评估,分析单元以多臂老虎机自适应决策优化方向,实现了探索–利用的动态平衡,在有限算力下获得最优收益。真实可复现的评测与落地:系统集成了 Qlib 回测环境、统一因子预测指标(IC、ICIR、Rank IC 等)与策略指标(ARR、IR、MDD、Calmar 等),确保评测过程真实可复现、结果可对比,强化了整体工程的可信度。

实证结果

在基于 A 股沪深300数据集的实验中,R&D-Agent(Q) 展现出了在效率、稳健性与收益表现方面的显著优势。

在仅优化因子维度的实验中,R&D-Factor 在固定模型的条件下,通过动态筛选与去冗余机制,实现了更高效的因子管理。与传统因子库相比,它使用的因子数量减少了70%以上,但同时提升了信息系数(IC)和年化收益率(ARR),证明了 R&D-Agent(Q) 在因子挖掘与筛选环节的智能化效果。

图4:R&D-Factor 实现的因子集超越了人工实现的因子集,且融合后可以获得最优的性能

在仅优化模型维度的实验中,R&D-Model 在固定因子集(如 Alpha 20)下,取得了更优的 Rank IC 和更低的最大回撤表现。与传统机器学习方法及通用时序深度模型相比,该系统展现出了更强的稳健性与风险敏感度,能够在波动市场中保持稳定收益。

图5:R&D-Model 实现的模型在性能以及效率上均超越已有模型

当“因子-模型”联合优化时,R&D-Agent(Q) 在综合指标上取得了最优表现。在部分实验设置下,其 IC 达到约0.0532,ARR约为14.21%,信息比率(IR)达到约1.74,均明显优于多种强基线方法,充分验证了“因子–模型协同优化”的有效性。

表1:R&D-Agent(Q) 与现有的因子和模型对比实验结果

表2:不同市场和样本外时间上,R&D-Agent(Q) 均展现了较强的鲁棒性

在成本与算力方面,R&D-Agent(Q) 同样展现出高效与鲁棒的特性。在论文设定条件下,其端到端实验成本低于10美元,并在不同的大语言模型后端上均保持了稳定的性能表现,为智能化量化研究的实际落地提供了可行路径。

图6:R&D-Agent(Q) 成本图

相关链接:

R&D-Agent / R&D-Agent(Q) GitHub 链接:

R&D-Agent-Quant 论文链接:

量化回测引擎 Qlib GitHub链接:

来源:不秃头程序员

相关推荐