FANformer:融合傅里叶分析网络的大语言模型基础架构 近期大语言模型(LLM)的基准测试结果引发了对现有架构扩展性的思考。尽管OpenAI推出的GPT-4.5被定位为其最强大的聊天模型,但在多项关键基准测试上的表现却不及某些规模较小的模型。DeepSeek-V3在AIME 2024评测中达到了39.2%的Pass 模型 架构 傅里叶分析 fanformer 傅里叶分析网络 2025-03-11 18:12 3