超越ChatGPT,DeepSeek在美国“登顶”!创始人将回广东过年

B站影视 2025-01-27 18:15 2

摘要:1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

苹果美国区应用商店

苹果APP Store中国区免费榜

Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。

土生土长的湛江人

今年1月20日,据新闻联播,国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

DeepSeek创始人梁文锋参加此次座谈会,梁文锋既是深度求索(DeepSeek)创始人,也是头部量化私募幻方的创始人,创业范畴横跨金融和人工智能领域。

央视新闻截图,左一梁文锋

梁文锋,1985年出生于广东省湛江市。在吴川一中九九届初三(五)班毕业师生合照中,梁文锋的身影赫然在列。他是湛江市吴川市覃巴镇米历岭村人,小学就读于吴川梅岭小学,父母都是小学语文老师。

最后一排右边第6个是梁文锋

梁文锋从小成绩优异,小学六年级时,他就通过考试被吴川一中录用,在吴川一中完成了初中、高中学业,一直是学校里的“尖子生”,并在数学学科表现出极大天赋。

“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”梁文锋的初中班主任容先生表示,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。

“来自东方的神秘力量”

2002年,梁文锋以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

2023年,梁文锋创立深度求索品牌DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”。

成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。

2024年5月,该公司发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。

同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。

2025年1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,并同步开源模型权重。

这些成果在国内外AI圈掀起讨论热潮,被称作“来自东方的神秘力量”。

Semi Analysis首席分析师认为,DeepSeek V2论文“可能是年内最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”。

公司多岗位招新

实习生日薪最高上千元

在团队配置上,DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。

近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。

通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。

其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。

值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

据悉,今年春节

梁文锋将回湛江吴川过年

这位名耀海外的“大神”

祝愿他创造出更多的奇迹!

来源:读特新闻

相关推荐