中国小公司打破美国企业霸权,国家很重视,创始人登上新闻联播

B站影视 2025-01-25 16:23 3

摘要:2020年美国OpenAI发布GPT-3后,各国科技企业都认识到了AI的巨大潜力,源源不断的资源投入到AI研发。

文 | 青菀杳声闻

编辑 | 青菀杳声闻

2020年美国OpenAI发布GPT-3后,各国科技企业都认识到了AI的巨大潜力,源源不断的资源投入到AI研发。

就连训练AI必需的算力芯片,都成了科技公司的竞争的香饽饽!

只是,美国在AI领域已经确立了绝对的领先:从文字AI软件GPT4.0到图片AI软件Pixso,再到视频AI软件Gen-3。

GPT4.0

各国在追赶美国AI水平上,还有很长一段距离。但是,我国的AI公司——深度求索(DeepSeek)的成功,让一众爱好者看到了希望!

2024年12月底,深度求索公司发布开源了最新的国产AI模型DeepSeek-V3,这款AI模型在中文、长文本、数学上的表现,远超其他的AI软件。

这一点的难度非常大!要知道,中文的训练资源与英文相比,真的算不上多,且各个资源之间并不流通,DeepSeek-V3做到了高效中文表现,架构一定有所创新。

DeepSeek-V3

根据官方的报道,DeepSeek-V3的性能不亚于美国最先进GPT4.0,中国AI模型站在台面上了!

今年1月20日,深度求索公司马不停蹄,又发布了最新的AI模型DeepSeek-R1,让各大科技公司惊讶的是,DeepSeek-R1不仅是性能强,还有一个人性化的特征:顿悟。

如果一个问题非常复杂,DeepSeek-R1模型在思考的时候,会列出一系列推理过程。

顿悟

但在这个过程中,DeepSeek-R1会突然停下来,将某一步骤标红,并且做出提示“这一步可能有误”,之后修正错误、继续生成回答。

这种“灵光一闪”的表现,和人类思考问题的方式很像,连国外的AI评论家都表示,这款AI模型的思考方式最像人!

甚至连训练方式,DeepSeek-R1都和主流AI软件不一样。

DeepSeek-R1

美国GPT训练AI模型,三个步骤必不可少:预训练、模仿、强化学习。而DeepSeek-R1直接跳过了中间步骤,让AI带着知识直接解题,并自我生成解题思路。

很多人震惊之余也猜测:深度求索公司接连发布AI模型,花的钱应该是个天文数字吧?

事实恰好相反!深度求索研发AI时,凸出一个“花小钱办大事”,比如,深度求索公司训练DeepSeek-V3的时候,仅仅花了588万美元,连GPT4.0的十分之一都不到。

深度求索

甚至连训练时间,深度求索公司也只花了两个月,这份“高效”,美国公司只能汗颜。

凭着世界顶尖的AI模型,深度求索公司名噪天下,创始人甚至登上了新闻联播,让人惊讶的是,这位创始人竟然如此年轻!

梁文锋

1月20日,关于《政府工作报告》的座谈会如期举行,各界代表、权威人士出席了会议,其中,一个年轻的面孔格外引人注意,他就是深度求索的创始人——梁文锋。

梁文锋是个85后,出身名校浙江大学信息工程专业,连续取得本硕学位,而他最先涉足的领域,并不是AI,而是金融。

08年金融危机,让梁文锋敏锐地看到了商机:如果把机器学习,用在“自动量化交易”会怎么样?

从2013年开始,梁文锋便一直在自动量化交易领域探索,随着时间的推移,梁文锋的交易模型逐渐向着AI转移,并且投入了大量资金,购英伟达的算力芯片。

2021年,梁文锋创办的公司获得了千亿级别的私募资金,在国内是最顶尖的几个,这一年,梁文锋不过36岁。

梁文锋的深度求索公司,接连推出两个AI大模型后,还做了一件震惊世界的事情——将两个大模型开源,允许业内所有企业一同推进技术发展!

报道

这种技术共享的做法,大大超出了人们的预料,美国科学家非常感叹,AI技术最初的研发目的,竟然被中国公司实现了。

不止如此,深度求索公司还把推理费用大幅降价,每百万token只收1块钱,消息一出,国内众多AI企业应声降价,深度求索公司将推理费用打了下来。

DeepSeek

如今梁文锋年仅40岁,就成为中国AI模型方面的泰斗级人物,今后的奋斗生涯还长着呢。
他的公司也将带领众多中国企业,走上“赶英超美”的道路,这在两年以前,我们根本无法想象。

看到深度求索公司的卓越表现,英国媒体也连连称赞,甚至发出了感叹“美国越制裁,中国发展的越快”。

梁文锋

在人工智能领域,算力芯片是手段、是创造AI模型的工具,AI模型才是最终的目的。

美国为了遏制中国AI的发展,在算力芯片上“严卡”中国,国内众多科技公司一度“缺芯少片”,深度求索公司虽然挺过来了,但也没少受美国禁令的影响。

2018年,梁文锋的幻方公司出现了算力不足的情况,只能花大价钱购买显卡,他用2亿的资金购入1100张高端GPU,组成了“萤火一号”平台。

DeepSeek-R

短短两年,梁文锋再次遇到这个问题,便又花了10个亿,从英伟达那里买了1万张A100。

再往后,美国禁令越来越严格,梁文锋想买都买不到了,可AI训练不能停啊,梁文锋的团队无奈之下,只能从训练的架构上想办法。

缺少算力,就不能想美国那样“大水漫灌”式的训练,这种“缺衣少食”的环境,反而倒逼出梁文锋团队的才智!

深度求索公司通过智能训练场,让AI训练比美国公司少了一步,既大大节省了算力投资,也让AI训练变得简单、廉价。

深度求索公司

虽然我国短时间内,还是无法解决算力芯片的缺少,但算力芯片的终点——AI模型,我国已经实现了突破!

今后的一段时间,正是我国AI大发展的时候,美国有资源、我国有方法,谁能走得更远,尚未可知!

中国AI

信源:

“DeepSeek崛起提醒我们:制裁越严厉,中企进步越快?”

DeepSeek创始人梁文锋参加总理座谈会,这家杭州科技公司有多厉害

像人一样“顿悟”?国产AI大模型DeepSeek将实现“Copy from China”

国产AI大模型DeepSeek冲破封锁全球刷屏,成本仅为GPT的1/20

来源:青菀杳声闻

相关推荐