厉害了浙江人!便宜好用的DeepSeekV3成中国人工智能“王炸”

B站影视 2025-01-02 11:24 2

摘要:前几天,浙江深度求索公司DeepSeek-V3横空出世,在AI行业内引发巨震,它是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型。

前几天,浙江深度求索公司DeepSeek-V3横空出世,在AI行业内引发巨震,它是一个强大的混合专家(Mixture-of-Experts, MoE)语言模型。

主要的技术迭代是671B的MoE,37B的激活参数,在14.8万亿个高质量token上进行了预训练。

据专业人士检测,它在MATH500、AIME2024和Codeforces三个维度更是遥遥领先,数学和编程能力极强,远超过GPT-4 和 Claude 3.5 Sonnet 这两大世界领先的闭源模型。

即使在某些语言理解和软件工程任务中稍有逊色,但也是TOP2尖子选手。

谷歌Meta AI 研究科学家田渊栋也在X上,对 DeepSeek-V3 “极有限的预算”和“强劲的表现”深感惊喜。

关键原因之一就是预训练成本之低——这个参数量高达671B的大模型,在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。

DeepSeek-V3相比大美丽 GPT-4等其他前沿大模型,性能却足以比肩乃至更优。

曾几何时,大美丽在人工智能领域一骑绝尘,其雄厚算力和科技公司的领先优势让人望尘莫及。

但就在今年,中国资深大V项立刚豪情万丈地说:"中国未来一定能引领人工智能发展,而不是美国!"

当时我看到这真的没法相信他的话,觉得他是在吹牛。

但看到浙江的深度求索公司DeepSeek-V3,只花了不到600万美元,只用了2000多块GPU,训练671B只需此前算力1/10,能取得如此非凡成就,我才彻底信了中国资深大V项立刚的预言。

我在网上搜索了一下深度求索公司DeepSeek,才发现这家公司就在浙江。

大家知道,浙江人最大的爱好就是搞钱,不管小钱还是大钱,反正越多越好。

于是,就有一帮聪明的浙江人开发了AI大模型DeepSeek版本,据说性能相当强悍,在中国股市拥有核动力镰刀之称,普通小散怎么可能斗得赢?

国家证监会一看这样不行呀,于是就让他们转行。

你要知道,在浙江,只要和高科技公司沾边的,政府都大力支持。

你们这个炒股用的AI大模型DeepSeek不是很厉害吗?那你就干人工智能大模型好了。

想不到浙江人读书聪明,挣钱也厉害,但没想到做AI大模型更厉害。

大美丽不是不让卖英伟达的高端GPU吗?那我就尽量少用。

谷歌和微软等公司不是财大气粗吗?我尽量花小钱干大事。

就如同孩子读书,有的学霸是靠家里堆钱堆资源,靠刷海量的题才当上学霸,而有的家境贫寒的学霸呢,家里没钱没资源,又没钱买参考书,只能靠自己认真学习,认真琢磨,把书真正读透了,读通了,照样变成学霸,而且是超级学霸。

你想想呀,看到浙江的深度求索公司DeepSeek-V3横空出世,大美丽那些靠堆GPU,靠花大钱造超级数据中心的一帮人,靠美股吹人工智能赚大钱的一帮人,是不是要哭晕在茅房里?

浙江人厉害的太多了,以后有空我再慢慢讲。

声明:部分内容和图片来自网络,侵删。

最后,这期关于这期话题,大家还有哪些不一样的看法?欢迎评论区留言分享。

来源:中国男孩教育一点号

相关推荐