摘要:开源数据集(占79%):Ant_Finance(支付宝团队,2023):侧重支付与风控场景。FinancelQ(独小漫DI团队,2023b):金融常识问答。FinanceQT(Malik, 2024):量化交易指令解析。ConvFinQA(Chen et al
对大模型,AI Agent有研究的朋友可以加入
开源数据集(占79%):Ant_Finance(支付宝团队,2023):侧重支付与风控场景。FinancelQ(独小漫DI团队,2023b):金融常识问答。FinanceQT(Malik, 2024):量化交易指令解析。ConvFinQA(Chen et al., 2022):对话式金融推理。FinQA(Chen et al., 2021):数值计算与单位转换。TFNS(匿名,2024):社交媒体舆情分析。Finance-Instruct-500K(Flowers, 2025):指令跟随任务。FinCorpus(独小漫DI团队,2023a):金融事件抽取。FinCUGE(Lu et al., 2023):跨文化金融理解。专有数据集(FinPEE,占21%):350道金融硕士入学考试计算题,涵盖经济学指标(如加拿大2011年人均GDP=379美元)、利率敏感性分析等。两阶段训练框架:监督微调(SFT):基于Fin-R1-Data优化基础模型(如Qwen2.5-7B-Instruct)。强化学习(RL):采用组相对策略优化(GRPO)提升推理连贯性与准确性。基准测试结果:
来源:HuggingFace
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!