浙大天才,震惊硅谷!DeepSeek梁文锋:人才要国内的,捐款偷偷的

B站影视 2025-01-29 22:44 2

摘要:1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。

1月28日,英伟达暴跌16.86%,5800亿美元蒸发,创造史上最大市值损失记录。

全美半导体行业,也集体陷入了恐慌:

博通跌超17%,台积电跌超13%,美国科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麦跌超5%……

而之所以有这些“变动”,源头是:

DeepSeek国产AI大模型的横空出世。

根据专业大模型排名Arena,在1月24日公布的最新排名:

DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型分类中与OpenAI o1并列第一。

投资领域的大佬Andreesen,曾先后投资过OpenAI、Databricks、Shield AI等Al产品,也频频感叹道:

DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。

DeepSeek是真的震惊了硅谷。

它之所以震惊,主要有两个原因,一是它是完全开源的大模型:

任何人都可以用。

二是用了极小的成本,更小的算力,更高明的算法,实现了比“前辈们”更强的能力,正如网上流传的那样:

用几百万美元,完成了几十亿美元的项目。

硅谷AI巨头们的神经,已经错乱了。

而主导这一切的,是一个极其低调的人:

梁文峰。

梁文锋和公司团队开发的大模型“DeepSeek-V3”上线后,轰动硅谷、震惊全球。

各种海外媒体中,梁文锋被称为:

来自东方的神秘力量。

因为在这之前,他实在太低调了。

可他的人生,一点都不简单。

梁文锋是湛江市吴川市覃巴镇米历岭村人。

他出生于1985年,成长于一个教师家庭,父母都是小学语文老师。

梁文锋成长阶段,赶上了“下海潮”,“读书无用论”一度传的沸沸扬扬。

他的好多同学,都先后“辍学”挣钱去了。

好在梁家父母作为老师,知道“读书”的重要性,从小就对儿子严格要求:

学生时代的梁文锋,一直是学校里的“尖子生”。

而且虽说父母都是教语文的,可梁文锋更感兴趣的是:

数学。

他天赋极高,初中时期就学完了高中数学,甚至开始学大学的数学。

梁文锋火了以后,他的的初中班主任容先生,在采访中表示:

初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合。

仿佛不需要花很多时间来学习,就可以学好每一个学科。

他是妥妥的“学霸”。

以至于2002年,17岁的梁文锋,以吴川市第一中学“高考状元”的成绩,考上浙江大学电子信息工程专业。

毕业了以后,又在浙江大学攻读研究生。

只是虽说就读于名校,可由于那个时候实在是太早,梁文锋读的AI工程专业前景并不明朗。

梁文锋也一度迷茫。

大学期间创业,还做过全自动绣花机等产品,走过一些“弯路”。

与众不同的是,梁文锋很快就根据实践,总结出了自己的方向:

算法。

所以早在大学期间,梁文锋就已经开始:

积累市场行情数据和探索全自动量化交易。

后来读研期间,梁文锋还发表过一篇关于PTZ摄像机目标跟踪算法的论文。

最重要的是当时,正赶上了全球金融风暴,他从中看到了历史的巨大机遇:

很长的一段时间,他都在尝试用把自己机器学习算法和金融联系在一起,实现自动量化交易。

一位梁文锋公司的交易员,曾描述过自己的工作:

早上开盘前开电脑,系统自检并进入交易状态,然后上网聊天打发时间。

如果今天没客户拜访,就看书、游泳、跑步、逛街。

早些年还会经常看交易报告,甚至介入人工操作,后来发现是没意义的事,做多反而错多,想起来才会看一下报告,有时候会为自己插不上手而黯然神伤。

听起来好像很“欠揍”,可那确实是事实。

那也是梁文峰努力的结果。

梁文锋从2008年,开始研究“自动量化交易”,一路边实践边探索,在2015年,创办了幻方量化基金公司。

和传统基金公司不同的是,量化投资的“模式”,它就是梁文锋所强调的:

不靠人力来做买卖抉择,而是在大数据基础上,依靠人工智能来买月殳票。

这一年,梁文锋才30岁。

努力多年的梁文锋,也到了收获的时候:

2018年,幻方量化因为表现亮眼,首次获得了中国私募证券领域的最高奖项——私募金牛奖。

2019年,幻方量化的管理规模突破百亿元。

2021年,幻方量化的资金管理规模突破千亿,成为行业内的“量化四大天王”之一。

梁文锋一跃成为了“大佬”,只是就像是他的同学说的:

有钱了以后,梁文锋的衣着打扮和为人处世也非常低调。

甚至连“捐款”,都是偷偷的。

比如2022年年度,幻方量化共计向慈善机构捐赠 2.2138 亿元,而在这之外,公司一名id为“一只平凡的小猪”的员工:

个人向慈善机构捐赠1.38 亿元。

要知道2022年上半年,非银金融行业共计捐赠,才1.65亿元。

而id名为“一只平凡的小猪”的员工,个人捐款金额就已经接近了这一数据。

关键整件事,完全是“私下”进行的,一点热度都没有。

一直到后来事情发酵,网友们才扒出“一只平凡的小猪”,其实就是:

梁文锋。

但其实2022年,梁文锋的日子也不是太好过。

因为各种原因,大概从2021年下半年,幻方量化也没有了往日的辉煌。

2021年9月开始,幻方量化的业绩便出现下滑。

宁波幻方量化至2022年4月,一度动态回撤超过20%。

可即便如此,梁文锋始终没有停止“慈善”,并且他又找到了新的方向:

人工智能。

3

故事的新篇章,开始于2023年5月:

38岁的梁文锋,宣布要做通用人工智能。

两个月后,创办了杭州深度求索人工智能基础技术研究有限公司,也就是DeepSeek公司。

其实在成立公司以前,梁文锋就已经布局:

在基金公司赚取的利润支撑下,梁文峰老早就开始大量采购英伟达的芯片。

一家基金公司,囤积了超过1万张芯片,这个数量比国内很多互联网大厂还多。

当时好多人在猜测梁文锋的意图,却没想到他其实是要“换赛道”。

做人工智能这一年,梁文峰已经是“商场老人”。

可DeepSeek团队,他摒弃了传统的“招人方式”,独具一格的选择了一个纯粹的本土研发团队:

只有中国程序员,没有海归人才。

好多被选中的,都是应届毕业生和毕业一两年的年轻人。

工作时间也不长,不少还是在读博士,即便是团队的管理者,也非常年轻。

最重要的一点是,梁文峰也不在乎应聘者的学术荣誉,或者发很多论文。

只需要你有热爱、有信仰。

在梁文峰的掌控下,DeepSeek团队的规模只有不到140人,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,就像他说的:

V2模型没有海外回来的人,都是本土的。

前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。

事实证明梁文锋,没有看错人。

他带领团队创建的DeepSeek,仅用2048张GPU,耗资557万美元,在53天内,打造出全球领先的大模型“DeepSeek-V3”。

所谓的DeepSeek-V3,一举动摇了闻名天下的OpenAI的统治地位。

关键所花费的经费,还不到其他硅谷AI开发团队的一个零头,甚至还不到这些团队一个主管的工资。

一位Meta的工程师,见证了DeepSeek的崛起以后,在美国科技公司员工社区Blind中,写道:

Meta的生成式AI部门正处于恐慌中。

这一切始于DeepSeek,它使得 Llama 4 在基准测试中已经落后,雪上加霜的是:

那个不知名的中国公司,仅有550万美元的训练预算。

工程师们正在疯狂地剖析DeepSeek,并试图从中复制一切可能的东西。

梁文锋真的带领团队,走到了最前面。

记得DeepSeek-R1上线之后,英伟达高级研究科学家JimFan在其个人社交平台表示:

我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初使命——通过真正开放的前沿研究赋能全人类。

可那正是梁文锋想要的。

就像是采访中,他曾经说过的:

中国的AI不可能永远跟随,需要有人站到技术的前沿。

是结束也是开始。

来源:今夜无设防

相关推荐