阿里发布AI模型新版本:称已超越DeepSeek和GPT-4o

B站影视 2025-01-29 17:07 1

摘要:中国科技公司阿里巴巴周三发布了其Qwen 2.5 人工智能模型的新版本,据称该模型超越了备受赞誉的 DeepSeek-V3。

鞭牛士报道,1月29日消息,据路透社报道,中国科技公司阿里巴巴周三发布了其Qwen 2.5 人工智能模型的新版本,据称该模型超越了备受赞誉的 DeepSeek-V3。

Qwen 2.5-Max 的发布时间比较特殊,正值农历新年的第一天,大多数中国人都下班回家与家人团聚。这意味着中国人工智能初创公司DeepSeek 在过去三周的迅速崛起不仅给海外竞争对手带来了压力,也给国内竞争对手带来了压力。

阿里巴巴云部门在其官方微信公众号上发布的声明中表示:Qwen 2.5-Max 的表现几乎全面优于 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。

他指的是 OpenAI 和 Meta 最先进的开源 AI 模型。

DeepSeek 于 1 月 10 日发布了基于 DeepSeek-V3 模型的人工智能助手,并于 1 月 20 日发布了 R1 模型,此举震惊了硅谷,并导致科技股暴跌。这家中国初创公司据称低廉的开发和使用成本促使投资者对美国领先人工智能公司的巨额支出计划提出质疑。

但DeepSeek 的成功也引发了国内竞争对手竞相升级自己的 AI 模型。

DeepSeek-R1 发布两天后,TikTok 所有者字节跳动发布了其旗舰 AI 模型的更新,声称该模型在 AIME 中的表现优于微软支持的 OpenAI 的 o1,AIME 是一项基准测试,用于衡量 AI 模型对复杂指令的理解和响应能力。

这与 DeepSeek 的说法相呼应,即其 R1 模型在多个性能基准测试中可与 OpenAI 的 o1 相媲美。

DEEPSEEK 与国内竞争对手

DeepSeek V3模型的前身DeepSeek-V2在去年5月发布后,引发了国内AI模型价格战。

DeepSeek-V2 是开源的,而且价格空前便宜,每 100 万个代币(或 AI 模型处理的数据单位)仅需 1 元人民币(0.14 美元),这促使阿里巴巴的云部门宣布将多款型号的价格下调高达 97%。

其他中国科技公司也纷纷效仿,包括百度。该公司于 2023 年 3 月发布了中国首个 ChatGPT 版本,以及中国市值最高的互联网公司腾讯。

DeepSeek 的神秘创始人梁文峰7 月在接受中国媒体 Waves 的罕见采访时表示,这家初创公司并不关心价格战,实现 AGI(通用人工智能)才是其主要目标。

OpenAI 将 AGI 定义为在大多数具有经济价值的任务上超越人类的自主系统。

尽管阿里巴巴等中国大型科技公司拥有数十万名员工,但 DeepSeek 的运作方式就像一个研究实验室,主要由来自中国顶尖大学的年轻毕业生和博士生组成。

梁在 7 月份的采访中表示,他认为中国最大的科技公司可能不太适合人工智能行业的未来,并将其高昂的成本和自上而下的结构与 DeepSeek 精益的运营和松散的管理风格进行了对比。

他说:大型基础模型需要持续创新,科技巨头的能力是有限的。

来源:鞭牛士

相关推荐