爆火!Deepseek登顶苹果中国及美国免费应用榜,创始人是湛江人

B站影视 2025-01-27 20:52 1

摘要:1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。

刷屏湛江人朋友圈

据南方都市报消息,来自湛江的梁文锋,这几天在湛江人的朋友圈刷屏。梁文锋把开源模型做到全球第一,他和公司团队开发的大模型“DeepSeek-V3”,轰动硅谷、震惊全球,被海外称为“来自东方的神秘力量”。 近日,这名85后现身《新闻联播》以AI初创公司深度求索(DeepSeek)创始人的身份,参加了一场国家超高规格座谈会,并现场发言。

在吴川一中九九届初三(五)班毕业师生合照中,梁文锋的身影赫然在列。今天,南方都市报记者从梁文锋的初中班主任获悉,梁文锋是湛江市吴川市覃巴镇米历岭村人,他小学就读于吴川梅菉小学,父母都是小学语文老师。

梁文锋从小成绩优异,小学六年级时他就通过考试被吴川一中录用,在吴川一中完成了初中、高中学业,一直是学校里的“尖子生”,并在数学学科表现出极大天赋,初中时期就学完了高中数学,甚至开始学大学的数学。

2002年,天才梁文锋17岁,他以吴川一中“高考状元”的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。

性价比超越OpenAI

据悉,“DeepSeek-V3”性价比超越估值1570亿美元独角兽OpenAI。有海外网友直接拿“DeepSeek-V3”和OpenAI发布的“GPT-4o”进行比较,结论是,“两款产品不相上下”。而性能比肩GPT-4o的DeepSeek-V3,投入研发费用为558万美元,训练成本不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

DeepSeek-R1 API价格。图源:澎湃新闻

去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”

“黑神话悟空”创始人冯骥:可能是个国运级别的科技成果

此前,1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

极目新闻综合南方都市报、海报新闻、每日经济新闻、证券时报、澎湃新闻、界面新闻

来源:极目新闻

相关推荐