韩咏红:中国AI科学家的“深度探索”

B站影视 2025-01-31 10:49 2

摘要:中国的人工智能(AI)科学家们看来已准备好在新的农历年扬眉吐气。总部位于杭州的一家小型实验室“深度求索”(DeepSeek),以一群年轻的中国工程师和“极客”般的老板,在成立仅一年多后,今年1月20日发布核心产品DeepSeek-R1模型,顿时惊艳各方,让AI

作者:韩咏红

总部位于杭州的一家小型实验室“深度求索”今年1月20日发布核心产品DeepSeek-R1模型。(路透社)

中国的人工智能(AI)科学家们看来已准备好在新的农历年扬眉吐气。总部位于杭州的一家小型实验室“深度求索”(DeepSeek),以一群年轻的中国工程师和“极客”般的老板,在成立仅一年多后,今年1月20日发布核心产品DeepSeek-R1模型,顿时惊艳各方,让AI业界在惊叹号中进入蛇年。

R1模型被发现几乎和美国行业巨头OpenAI一样好用,训练成本却不到600万美元(810万新元),只等于OpenAI的几十分之一,使用的是低功能晶片。

农历除夕前一天(1月27日),Deepseek应用同时登顶苹果中国地区和美国地区应用商店免费App下载排行榜,超过了OpenAI的ChatGPT。同日,美国晶片龙头英伟达股价则历史性重挫17%,市值蒸发近6000亿美元,写下美国股市史上一家公司的最高单日跌幅纪录,欧美科技股也连带大跌。

至今,这股冲击波仍在回荡。人们原本认为,开发领先的AI需要使用大量昂贵的高阶晶片,因此美国如果阻断中国对高阶晶片的获取,就可以把中国排除在AI的竞争之外,并由此在超级计算机、机器学习、算法和软件开发等领域让中国吃大亏。结果,DeepSeek颠覆了这个预设,无异于在AI的领域为中国绕弯开出了一条路。

中国科学家的这场深度求索,给西方AI产业界还带来另一层深度震撼。正如英国《经济学人》杂志的评论,过去两年来,美国大型AI实验室都在比拼谁的模型能实现微小的质量提升,而不是谁能造出价廉物美、运算速度更快的模型。在这方面,DeepSeek展示了一种更好的竞争方法。

DeepSeek的创始人叫梁文锋,今年40岁,毕业于浙江大学。梁文锋有金融背景,曾是一家对冲基金公司的首席执行官,管理自己与伙伴在2015年联合创立的“幻方量化” 对冲基金,利用AI分析金融数据做出投资决策,进行量化交易。幻方量化管理的私募资金一度超过千亿人民币,梁文锋本人则成了亿万富翁,用对冲基金的收益来支持他的AI实验室。在成立DeepSeek以前,梁文锋在2021年就囤了上万个英伟达GPU晶片,有人不明所以,视之为富豪的特别爱好。

《金融时报》则引述梁文锋的生意伙伴形容他“一身书呆子气、发型糟糕”。就这点而言,有兴趣者可以找找1月20日中国央视新闻联播的画面,梁文锋当时是中国总理李强主持专家座谈会的座上宾,镜头下能看到他在发言,观众可以核实一下他是否“发型糟糕”。

DeepSeek创始人梁文锋出席中国总理李强主持专家座谈会。(互联网)

虽然如此,大量的西方主流媒体与评论人并未全然对DeepSeek采取否定的态度,其中还不乏正面评价,甚至隐隐透出对这名中国技术理想主义者的好感。一些英美媒体也看到,DeepSeek也许吓坏了股民,打击了科技公司的高利润率,以及部分抵消了美国打压中国AI发展的企图,却可能让整个AI产业与所有用户受惠。

梁文锋的深度探索,让人们重新思考与评估美国科技公司与晶片制造商吸纳高额投资再赚取垄断式利润的商业模式,是否合理与可持续?假如DeepSeek展示的成绩是真实的——它并没有隐藏成本或中国政府的补贴,那这意味着AI可以以更便宜的价格、更广泛地被人类利用到更多的应用场景,转化为生产力,改善更多人的生活,而且不被任何一个国家垄断。最终,消费者将会是大赢家,中美之外的其他中小国家也会受益。

DeepSeek和阿里巴巴“通义千问”一样都使用开源模型,而且每回发布新模型,也会发表论文公开大量技术细节。从商业的角度说,他们免费提供了OpenAI想要收费的内容。在国际关系上,全球所有国家都可以使用它们开发的开源生成式AI,这等于给了许许多多国家另一个选择,减少对美国以及中国的依赖,也少些选边的压力。

这可能来源于梁文锋今年除夕感言中提到的“知识和信息平权”信念。他去年7月接受中国媒体采访时,表明自己的出发点不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展;他认为中美差距不是一年或两年,而是原创和模仿之差,中国AI不能永远跟随,不能一直搭便车。

他在除夕夜则写下感触:“真正伟大的从不是某个模型,而是千万普通人用它创造的善意涟漪。”当人们已经非常习惯看到科技企业家名成利就,在资本市场呼风唤雨的此时,再次看到理想主义的行动与表白,我们终于回想起科学技术原本应该有的样子。但愿作为人类最前沿科技的AI,体现的是人类集体的胜利与善意,而不是地缘政治或实力原则的再次胜出,希望DeepSeek的探索会提供好的示范与启示。

来源:早报网

相关推荐