摘要:10月份AI领域最有看点的新闻是什么?除了OpenAI开放成人内容、发布首款浏览器ChatGPT Atlas之外,最有看点的还有AI大模型炒股(币)大赛。
10月份AI领域最有看点的新闻是什么?除了OpenAI开放成人内容、发布首款浏览器ChatGPT Atlas之外,最有看点的还有AI大模型炒股(币)大赛。
自AI大模型诞生以来,就有不少人寄希望于它,想要通过AI的聪明才智来炒股投资,这是一个伟大的梦想,但不知到底有多少人真正实际操作起来。现在我们终于有机会看到这番奇妙景象了。
2025年10月18日,国外的AI研究实验室nof1.ai发起了一场名为"Alpha Arena"(阿尔法竞技场)的实验项目,将全球六大主流大模型投入真实的加密市场进行交易竞赛。这六大模型主要是Claude Sonnet 4.5、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok-4以及Qwen3-Max。
需要注意的是,这不是模拟盘,而是真金白银的对决:每个AI模型各获得1万美元的初始资金,在Hyperliquid永续合约交易所进行自主交易,交易对象涵盖BTC、ETH等主流加密货币。这场实验的目的只有一个:这些AI,谁能真正赚到钱?
nof1.ai精心制造了严格的对标条件,所有六个AI接收完全相同的初始指令(Prompt),获得完全一致的实时市场数据流,包括价格、成交量、资金费率等信息。交易规则统一明确:每个模型可自主决定何时开仓、何时平仓、使用多少杠杆,目标是在风险可控的前提下实现收益最大化。
所有交易记录、钱包地址、持仓情况和思考过程均实时公开透明,任何人都可以在官网上追踪。这意味着这场实验的唯一变量就是各个AI模型本身的"思考方式"——它们各自独特的架构、参数权重和决策逻辑。
nof1.ai甚至开启了实时直播,大家可以通过以下链接去看AI们的实时表现。
从10月18日启动至今,交易竞赛已进入第九天(截至10月26日)。目前的总体成绩排名呈现出明显的地区分化特征,这一结果出乎许多业界人士的意料。根据最新数据统计,目前的总体排名情况如下:
值得一提的是,这期间BTC的走势是涨了4.42%,如果以BTC的价格作为参考基准线,那么除了Qwen3-Max和DeepSeek V3.1之外,其他四个国外模型全部没有跑赢大盘,都陷入了亏损,而且Gemini 2.5 Pro和GPT-5的表现最为惨淡。
以上六个AI模型在实际交易中展现出了迥异的风格,这进一步揭示了不同模型的决策哲学。
先来看Qwen3-Max。它的交易风格相当稳健,目前持仓十分单一,只持有BTC一个品种,从交易历史来看,虽然Qwen3-Max也买过一些ETH、SOL等别的品种,但是最后依然坚定的选择了BTC。另外,Qwen3-Max的平均杠杆也只有15.4倍,整体风格相当稳健。
我们节选一些Qwen3-Max讲述的交易“经验”:
“我的投资组合表现强劲,回报率高达75%,但面对市场狂热,我仍牢牢掌控着BTC仓位,严格执行离场计划。可用现金储备较低,因此暂时不会进行新操作。”
“持有20倍杠杆的BTC多头仓位,盈利7168美元,信心评分良好。现金余额较低,仅97美元,但迄今总回报率稳健达75%。我将坚持当前BTC离场计划,不作任何调整。”
“相较于初始本金,资产增值74%,夏普比率表现良好。持有20倍杠杆的BTC仓位,对其上涨空间充满信心,并已制定明确的离场策略。”
另外,Qwen3-Max的交易频率并不频繁,在10月21日操作9笔之后,10月22日仅操作4笔,10月23日操作1笔,之后到现在一直没有继续操作。
与Qwen3-Max相反,GPT-5从比赛开始就一直在走下坡路,目前总收益率亏损70%,基本上是“翻身”无望了。
GPT-5的杠杆只有16.4倍,并不高,但是它的持仓十分丰富,基本上能买的全都有,持仓过于分散。可能它想的是要均衡投资,但是这些投资标的并不是每个都优质,反而全部持有影响了整体收益率。
我们来看看GPT-5的交易心得:
10月26日,GPT-5已经亏了70%,但是它绝不割肉:“我仍持有所有仓位,因市场信号——尤其是4小时MACD与价格走势——尚未触发任何提前平仓条件,且目前尚未达到获利了结时机。尽管遭遇显著回撤,我仍在持续关注ETH、SOL、BTC、XRP、DOGE及BNB的走势,现阶段仍信任既定的离场策略。”
GPT-5给人的感觉是一个老散户,坚信技术分析,而且绝不割肉。
“尽管整体亏损严重,我仍维持当前在ETH、SOL、XRP、BTC、DOGE和BNB的持仓,因未触发任何止损条件,并将现有止损与止盈订单保持不变。同时确保此前缺少止损/止盈订单 ID的XRP和DOGE仓位,已按既定目标完成正确标记。”
10月25日,GPT-5决定“扭转当前颓势”:“尽管当前持仓较初始资金大幅缩水,但ETH、SOL、XRP、BTC和BNB均呈现未实现盈利。我正密切监控D0GE的0.208323盈利目标与BNB的止损条件以管理仓位,同时紧盯MACD柱状图等关键指标以判断潜在离场时机,力图扭转当前颓势。”
目前,GPT-5依然计划持仓观望,现在这个境地似乎是割无可割了:“当前我的策略是持仓观望,尽管整体遭遇大幅回撤,但所有加密货币持仓均未触发基于MACD指标和价格阈值的止损条件。我正密切追踪ETH、SOL、XRP、BTC、DOGE和BNB的走势,严格执行各自的盈利目标、止损位、杠杆比例及信心等级设定,以应对当前市场波动。”
从交易频率上看,GPT-5在10月21日交易了13笔,毫无疑问,全是割肉订单,这13笔没有一笔是盈利的,全都是亏损的交易……然后在10月22日,GPT-5交易了12笔,除了其中2笔是盈利之外,其他10笔全是在割肉。不得不说,GPT-5这操作像极了散户。
DeepSeek V3.1和Qwen3-Max之所以能够在竞争中脱颖而出,其内在原因值得深入探讨。DeepSeek V3.1背后是中国顶级量化基金幻方量化团队,这家管理规模超千亿元的量化巨头,其核心竞争力在于从量化交易出身,已在算法交易领域积累了深厚的专业积累。
从量化交易到AI大模型,再用AI进行真实加密交易,DeepSeek V3.1某种程度上是回到了自己的“老本行”,这种背景使其在风险管理、头寸控制和市场理解上拥有先天优势。
相比之下,GPT-5、Claude和Gemini等模型虽然在通用语言理解和生成能力上表现卓越,但这些能力与金融交易的决策逻辑存在本质差异。纯粹的语言能力在加密市场的快速波动中并不能直接转化为盈利能力。
这场实验对AI模型评测来说是新颖的,但可能对不少模型来说并不公平,比如通用语言模型在金融决策任务上的可能有局限性。不过无论如何,这样的实验还是很有趣,至少解开了我们心中的谜底。
需要注意的是,此次第一季实验将于北京时间2025年11月4日上午6点截止,随后还将推出第二季,届时预计会有“重大更新”。我们将持续关注,看看第一季比赛,Qwen3-Max会不会持续保持第一,也看看GPT-5能否逆风翻盘。
来源:沐南财经