来自广东的他,让硅谷刮目相看

B站影视 2025-02-09 19:53 3

摘要:最近,中国的APP屡屡霸榜,前有收留tiktok难民的小红书,后有人工智能新秀DeepSeek,据称这款AI工具价格是GPT-4 Turbo的百分之一,被称为AI界的“拼多多”,不少国外技术人员非常喜欢。

最近,中国的APP屡屡霸榜,前有收留tiktok难民的小红书,后有人工智能新秀DeepSeek,据称这款AI工具价格是GPT-4 Turbo的百分之一,被称为AI界的“拼多多”,不少国外技术人员非常喜欢。

1月27日,由杭州深度求索开发的DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

这家公司在外国AI界受到极大赞誉,在被美国禁止各种高性能芯片的中国,居然有公司用五百多万美元和低功能芯片,做出了OpenAI投入不止十亿美金和采用高端芯片的成果。DeepSeek还是内地除了商汤、百度、腾讯、字节跳动和阿里五大巨头以外,唯一拥有超过一万张A100显卡的公司。因此也被很多AI界的人士形容为“来自东方的神秘力量”。

公司的创始人也一直十分神秘,直至近日央视新闻联播的一则新闻,大家才见到真面目。在1月20日中国国务院总理主持召开的专家、企业家和教科文卫体等领域代表座谈会上, 梁文锋作为代表发言,逐渐为外界所认识。

镜头扫过,一双黑框眼镜、一身灰色西服、略显消瘦的身形,让一众理工男羡慕的发量,十分普通的路人长相,竟是AI大佬。

公开信息显示,梁文锋1985年生人,从小热爱数学建模,17岁时以湛江吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。

在2023年创立深度求索品牌DeepSeek之前,梁文锋在做证券投资。

梁文锋毕业后与校友成立了投资公司,聚焦量化交易。2019年,幻方量化管理规模突破百亿人民币,成为国内量化私募“四巨头”之一。此后的幻方量化甚至一度成为中国首家突破千亿的私募量化大厂,也是迄今为止业内唯一规模曾迈过千亿人民币大关的量化私募。

2019年,梁文锋在一个颁奖典礼上做主题演讲

2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司。此时美国的Open AI已经发布GPT-4,全球关注。但从私募积累了资金和算力的DeepSeek,还是很快追赶上来了。

有分析认为,DeepSeek之所以震撼硅谷,在于其颠覆了以GPT为代表的传统AI。后者的策略本质是“在人类监督下的猜字谜游戏”,最多生成一些“看似靠谱实则无法深究”的东西,根本没有办法投入现实、转化为生产力工具。但DeepSeek不一样,DeepSeek是真的会“思考”,或者“推理”。

在2023年的一场访谈中,梁文锋就说过,我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。

这篇访谈据说是技术宅男梁文锋的首次受访,语言简洁,充满对人工智能纯粹的好奇。

此外,在特朗普上台后,芯片制裁风波来袭。而DeepSeek的成功,意味着之前一个阶段里美国的“小院高墙”制裁策略可能要失效了。

诺贝尔物理奖得主、“AI教父”杰佛瑞·辛顿在1月21日的专访中表示,尽管美国试图通过限制晶片等来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。

纽约时报的文章说,随着美国政府努力保持本国在全球人工智慧竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能晶片进行限制。但DeepSeek大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。

梁文锋曾这样总结中国AI和美国AI的差距。“我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”

来源:香港八卦瓜

相关推荐