摘要:最近,一家来自中国的 AI 公司 DeepSeek,在美国狠狠火了一把,各大媒体和社交平台都在讨论它,这热度,就像一颗突然升起的新星,让人忍不住好奇:它到底有啥能耐?
最近,一家来自中国的 AI 公司 DeepSeek,在美国狠狠火了一把,各大媒体和社交平台都在讨论它,这热度,就像一颗突然升起的新星,让人忍不住好奇:它到底有啥能耐?
DeepSeek 的创始人是梁文锋,他的经历为 DeepSeek 的发展奠定了坚实基础. 1985 年,梁文锋出生于广东省湛江市,2002 年考入浙江大学电子信息工程专业,后于 2010 年获得该校信息与通信工程硕士学位. 2008 年全球金融危机时,他便带领团队探索机器学习技术在全自动量化交易中的应用,为日后职业生涯奠定基础.
2013 年,梁文锋与浙大同学徐进创立杭州雅克比投资管理有限公司,2015 年又创立杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。幻方科技在量化投资领域成绩斐然,2021 年其资产管理规模突破千亿大关,跻身国内量化私募领域的 “四大天王” 之列.
2019 年,梁文锋带领团队自主研发了 “萤火一号” 训练平台,总投资近 2 亿元,搭载了 1100 块 GPU;2021 年,“萤火二号” 投入增加到 10 亿元,搭载了约 1 万张英伟达 A100 显卡,为其在人工智能领域的发展提供了强大的算力支持.
2023 年,梁文锋宣布将正式进军通用人工智能领域,并创办了 DeepSeek,专注于做真正人类级别的人工智能. 2024 年 5 月,DeepSeek 发布混合专家语言模型 DeepSeek-V2;同年 12 月,DeepSeek-V3 问世,这款性能优越且性价比极高的大语言模型,被硅谷同行誉为 “来自东方的神秘力量”.
故事得从 1 月 20 日说起,DeepSeek 发布了 R1 模型,这模型一亮相,可不得了,直接对标 OpenAI O1 ,性能相当能打。在专业大模型排名 Arena 上,DeepSeek-R1 基准测试已经排到全球全类别大模型第三,在风格控制类模型里,和 OpenAI o1 并列第一,整体得分还略超 OpenAI o1 ,这成绩,足够亮眼。
2025年1月26日Chatbot Arena全球大模型实时排名:Deepseek-R1跃居全球第三,超过OpenAI最新大模型o1
大佬们也纷纷下场点赞,华尔街顶级风投 A16Z 创始人 Marc Andreesen 就毫不吝啬地夸 DeepSeek R1 是他见过最令人惊叹、印象深刻的突破之一,还特别强调是开源的,简直是给全世界送了份大礼。要知道,这位大佬投过 OpenAI、Databricks 这些行业大拿,他的认可,分量可不轻。
硅谷风投A16Z创始人对Deepseek给予极高评价 - ”非常印象深刻的科技突破 -是给世界的一个具有深渊影响的礼物“
还有上个月发布的 V3 模型,更是把 “性价比” 拉满。只用 550 万美元、2000 张卡就做出来了,效果却和 OpenAI 花几亿美元烧出来的不相上下,这低成本高回报的操作,谁看了不得说一句牛!
DeepSeek 能这么厉害,背后是有原因的。就说 V3 模型,它用了创新技术。
数据蒸馏技术,像个聪明的筛选器,从海量数据里挑出关键信息,生成高质量训练数据集,不仅减少了数据量需求,还提升了模型训练效果;FP8 混合精度框架,在保证计算精度的同时,大幅降低内存使用和计算成本,让训练更高效。在实际应用上,DeepSeek-V3 也是多面手。数学领域,复杂问题轻松解决,帮科研人员加速科研进程;编程时,能自动生成高质量代码片段,还能检测修复错误,软件开发人员爱了;多语言任务处理方面,不管常见还是冷门语言,翻译都不在话下,跨国沟通更顺畅;智能客服领域,支持多轮对话和续写,交互自然流畅;还能处理图像、音频等多模态数据,给智能助手、移动应用等带来更多可能。
Deepseek R1在各项模型测试表现上媲美或超越Open AI旗下系列模型(来源:Deepseek)
美国媒体对 DeepSeek 的关注,那叫一个密切。《纽约时报》报道时,满是羡慕和警惕,既惊叹于 DeepSeek 大模型以 600 万美元低成本、2000 块芯片,就实现和巨头媲美的性能,挑战了 “只有科技巨头才能研发尖端 AI” 的共识;又担心中国通过开源主导权重构全球 AI 竞争格局。其他主流财经媒体也纷纷聚焦,CNBC 还专门做了 40 分钟深度视频,讨论美国 AI 是不是受到威胁,这关注度,足以证明 DeepSeek 的影响力。
美国媒体报道:Deepseek对美国在AI领域的统治力产生重大威胁
DeepSeek 的成功,就像一颗投入 AI 行业湖面的石子,激起层层涟漪。它降低了 AI 研发门槛,让更多小型机构和企业有机会参与进来,激发了行业的创新活力,研究方向和应用场景也变得更加多元化。不过,门槛降低,竞争也更激烈了,研发团队得不断提升实力,才能在这浪潮里站稳脚跟。
总的来说,DeepSeek 的崛起,是中国 AI 在世界舞台上的一次闪耀亮相。它用实力证明,创新和努力,能打破常规,在 AI 这场激烈的全球竞赛里,开辟出自己的道路。未来,DeepSeek 又会带来哪些惊喜,让我们拭目以待!
中美的AI科技竞争才刚刚拉开帷幕
来源:走进科技生活