DeepSeek到底是个啥?

B站影视 2025-02-01 20:33 2

摘要:这两天DeepSeek爆火出圈,几乎所有媒体平台都在刷屏,资本市场更是大涨。本来是不太想聊,毕竟科技博主或者软件研究员讲得会更专业,但后来发现他们讲得好像有点太专业,有些内容我都不是很看得懂。

这两天DeepSeek爆火出圈,几乎所有媒体平台都在刷屏,资本市场更是大涨。本来是不太想聊,毕竟科技博主或者软件研究员讲得会更专业,但后来发现他们讲得好像有点太专业,有些内容我都不是很看得懂。

既然DeepSeek能够撼动华尔街和硅谷,并且一举把英伟达股价都拉下来(盘前已超跌10%),很值得骄傲,那收官之文就留给她吧,我来试试用大白话解读。

首先,DeepSeek到底是个啥?

DeepSeek实际是人家的英文名,这家公司中文名叫深度求索(很喜欢这个名字,做价值投资就是要深度,异曲同工),出身背景不算强势,母公司不是互联网或科技大厂,而是国内一家量化私募基金,幻方量化。

当然幻方绝不算是“小虾米”,一度是中国首家突破千亿管理规模的私募基金,业内颇有名气(甚至可怕)。

老读者都知道,做研究要先看“人”。幻方量化及DeepSeek创始人,叫作梁文锋,出生于1980年代广东一个五线城市,本硕都就读于浙江大学,攻读人工智能专业。

这位“奇才”面貌如何?下面这张,就是梁文锋1月20日参加总理座谈会的央视直播画面,很年轻,而且还挺清秀。

近日,DeepSeek-R1在Chatbot Arena综合榜单上升至第三,与OpenAI的顶尖推理模型o1并列。其应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,点燃了全球关于人工智能发展格局的深度讨论。

1、新闻报道

这几天,中国AI 新创公司深度求索(DeepSeek)先后发布了DeepSeek-V3 和DeepSeek-R1 两款大模型,成本价格低廉,性能与OpenAI 相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

DeepSeek,甚至冲上美国APP Store免费APP下载榜第一名,被称为东方神秘力量,而DeepSeek创始人梁文锋的超狂背景也曝光。据悉,该团队成员都来自顶尖学校,核心成员是应届生,才女罗福莉(据媒体报道,雷军为罗福莉开出了千万元级别的年薪)也参与开发。

梁文峰搞出来的deepseek有多强大呢?他在短短1个月之内就震惊了西方科技界两次。

第一次是在2024年12月底,deepseek发布了一个叫deepseek—V3的AI模型,对标的是open AI的GPT4O,当时美国的AI界的众多大佬们瞬间就炸锅了,炸锅的原因是:

第一,中国居然能搞出这么先进的模型;

第二,训练出来的这个V3模型,deepseek团队仅用139人,2048块低端GPU,花费两个月以及557.6万美元,而对比一下谷歌和open AI,他们上千人的团队,花费了好几年时间,耗资数亿美元,调用了几万块最先进的GPU才干成同样的事。

紧接着在1月20号,也就是距离上次V3版本发布不到一个月,deepseek又发布了一个叫deepseek-R1的模型,颠覆了“中国AI依赖西方开源”的刻板印象,让西方科技界再次震惊。

但没想到,这个并不老练的团队,仅用一年多时间,就推出了模仿人类思维的DeepSeek-R1,在数学、编程自然语言推理等任务上,性能比肩当前“地球最强大脑”——OpenAI o1。

首先,肯定是这个小公司在AI领域有了特别重大突破;其次,就是这个突破在世界上都属于领先。DeepSeek的横空出世,让美国科技圈睡不着觉,同样也让很多国人睡不着觉。

不起眼的小公司DeepSeek,靠性能较差的硬件和并不老练的团队,掀翻英伟达,有人说,这是以少胜多、以弱胜强。但我认为,任正非说得对:从国外引进来的高新技术,打开后发现竟是中国鸡下的蛋。中国从来不缺人才,也不缺天才,缺的是敢想象,敢独立自主走自己的路。

硅谷半导体神话故事的天花板终于被桶开了一个窟窿,英伟达的故事被梁文峰做成了事故,我们终于等来那只可以引发大洋彼岸科技股神话松动破灭蝴蝶效应的那只全世界等待的蝴蝶。属于我们的世纪,终于缓缓地打开了那扇沉甸甸的大门。

Deepseek如何deep(深度)seek(求索)?尽管DeepSeek当前风光无限,但要积大胜为常胜,还需立足后续发展,久久为功,保持定力,卯足后劲。中国科技企业若想实现从“跟跑”到“领跑”的质变,既需珍惜当前的技术窗口期,更需克制“毕其功于一役”的心态,持之以恒,不断求索,方能行稳致远。

在GPT-5即将发布、量子计算革命蓄势待发的背景下,DeepSeek的阶段性成功只是序章。这场始于技术突破的轰动事件,终将演变为文明智慧的集体试炼。DeepSeek一是原创,二是便宜,犹如少林寺突然闯进来一个小孩,击败众高僧,这就好比一个低成本的中国电影在大片云集的美国拿了票房冠军一样,你敢相信吗?但是,此事千真万确!

梁文峰的两句话特别打动人们的心:第一句 "不一定是做过这件事的人才能做这件事,看重基础能力、创造性和热爱,而不是经验" , 这也是DeepSeek能够创新的关键。第二句 "中国AI不可能永远跟随",没有情怀,没有热爱,是不可能做出DeepSeek这样的产品的。

传统认知中都是美国擅长0-1的创新,中国擅长1-10的应用创新。而DeepSeek的出现让中国也可以引领0-1的创新,称为国运级别的科技成果并不为过。为何说DeepSeek比六代机的影响大万倍?因为它摧毁了美国当下的所有战略目标!2025年,中国AI将会迎来大爆发!“星际之门”出身未捷身先死?DeepSeek竟使美国AI泪满襟!

2、杭州深度求索人工智能基础技术研究有限公司(DeepSeek)

在人工智能领域,“深度求索”通常指的是杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。以下是关于它的一些信息:

(1)、公司概况

成立时间:2023年7月17日。

背景:由知名量化资管巨头幻方量化创立。

团队规模:团队成员数量不到140人。

严格来说,DeepSeek发展历史能追溯10年:

2015年,梁文锋和朋友创办幻方,立志成为世界顶级的量化对冲基金。

2016年,幻方量化推出AI模型,是第一份由深度学习生成的交易仓位。

2023年7月,梁文锋创办深度求索DeepSeek,专注于AI大模型的研究和开发。

2024年底,DeepSeek就发布了第一个模型叫DeepSeek V3,当时美国AI大佬就炸锅了,称之为“神秘的东方力量”。

2025年1月,仅仅过了不到1个月,DeepSeek再次发布新模型DeepSeek R1,正式火爆出圈。

大模型说起来很高端,落地后就是每个人都能使用的APP(也有网页端)。就像当时Kimi和豆包被纷纷下载,DeepSeek也被一顿“薅羊毛”,老外甚至用得更起劲,DeepSeek在美区苹果App Store免费榜直接飚升至第一名。

要知道,国内大模型并不少:字节豆包、月之暗面Kimi、阿里通义千问、百度文心一言、讯飞星火、腾讯混元等等,个个发展得不错,但大部分都没能给美国科技界带来压力,凭什么DeepSeek就有威胁性?

相关解读很多,我就从自己角度来讲讲看,可供参考。

第一,质量绝对过关,评分基本上不输给OPENAI。

不多啰嗦,直接看下面这张图,第一根深蓝色是DeepSeek R1模型,第二根灰色是OPENAI o1模型:

美国OPENAI算是世界级标杆,面对如此强敌,DeepSeek能做到只有1个指标略显逊色,其他都能齐平甚至超越,足以证明实力雄厚。

第二,千言万语,便宜就是硬道理。

如果有了解汽车,DeepSeek就是大模型界的比亚迪(或小米),如果不了解也无妨,更通俗些,DeepSeek就是大模型界的“拼多多”。

还是和“老大哥”OPENAI相比:

OPENAI收取每百万输入词元15美元和每百万输出词元60美元;

DeepSeek收取每百万输入词元0.14美元和每百万输出词元2.19美元。

根本不用管什么输入词元还是输出词元,就记住,DeepSeek要比OPENAI便宜90%以上。

为什么能卖得便宜?成本低啊。OPENAI训练个模型要砸4亿美金,DeepSeek只要550万美金,效果差不多,相当于用拼多多价格做出爱马仕(当然我本人很不支持冒牌货哈)。

差不多的两个软件,一个卖100元,一个卖10块钱,消费者选择过于简单。

这种算不算是内卷?创始人梁文锋在被采访时表示,自己不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。没想到价格让大家这么敏感,他只是按照自己的步调来做事,然后核算成本定价。

这波,确实让他给装到了。

第三,100%开源,等于全世界工程师都在帮忙优化。

可能有朋友不太熟悉软件行业,啥叫开源呢?

做个简单类比:把软件想象成房子,以前这房子的建造图纸只有房子的主人有,其他人想住没问题,但想要知道房子是怎么建的,没门儿。开源,就是房子主人把图纸直接公开了,每个人都能看到怎么设计和建造。

OPENAI是闭源的,如今DeepSeek直接开源,打破了行业格局:卖得便宜就算了,还把业内机密公开,别人再想关起门来收门票,就要被千夫所指。

更绝的是,开源后相当于现在全球无数程序员都在帮着改进系统,像极了当年安卓对抗苹果的剧情。

总结而言,DeepSeek凭借着好东西+好价格+公开透明(越来越像价值投资),一举震惊了全球科技界。

美国AI科技初创公司Scale的创始人亚历山大(这个名字还挺应景)更是直言:DeepSeek的AI大模型发布可能会“改变一切”,让美国在人工智能竞赛中的领先地位受到挑战。

当然,值得庆贺是一方面,但还不至于自满,比如处理超长文本、多模态能力(语音交互)、专业领域优化、训练数据等各方面,DeepSeek以及国内其他大模型都和OPENAI仍有差距。

好戏才刚开始,但至少证明了一件事:在AI这个世界级牌桌上,中国玩家终于不再是看客。

我这两天也用了DeepSeek,确实不错,尤其输出内容特别有逻辑性。模型里有个选项叫“深度思考”,就是把大模型是怎么回答问题的过程,给你展示出来。

这个有点厉害,至少在之前任何大模型里都没见到过,我截个图给大家感受下,灰色部分就是大模型深度思考的过程:

读者们如果有兴趣,春节期间没事也可以尝试着用用,到时候有啥好玩的模式或者用法,就能一起多多探讨,我想肯定会很有趣。

至于投资端,短期明显是题材概念,不是我所擅长的能力圈范围,长期肯定看好AI人工智能大趋势。以及,我觉得算力依然稀缺,原因是大模型搞得越高效,AI应用的需求就会越多,到时候算力总盘子就得增加。

就像现在软件效率都很高,但手机和电脑的内存却是越来越不够,因为需求在不断提升。记得以前手机内存64GB就足够,现在新手机都已经提升到1TB内存。

好了,差不多就是这些内容,希望这篇文章对大家能有所帮助。

近期科技领域不断传来好消息,人工智能有豆包和DeepSeek,人形机器人有宇树,新能源车更是碾压,全球科技创新和高端制造都有国内企业的身影,为祖国而骄傲,也要致敬这批优秀的创业者和企业家。

来源:奥卡姆剃刀

相关推荐