AI“天才少女”刷屏,雷军花千万年薪招揽!参与开发的国产大模型火爆全球

B站影视 2024-12-30 12:24 3

摘要:最近,国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。据证券时报报道,雷军亲自出手挖人。据悉,支付的薪酬在千万元级别。

最近,国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。据证券时报报道,雷军亲自出手挖人。据悉,支付的薪酬在千万元级别。

国产大模型DeepSeek 火爆全球

近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏!

据券商中国报道,Deepseek的中文名是“深度求索”,为量化巨头幻方量化的子公司。

今年5月,Deepseek发布的一款名为DeepSeek V2的开源模型,因其史无前例的性价比,在AI界一跃成名。

12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。

图|Open AI创始成员之一Andrej Karpathy在个人社交平台发文

Open AI创始成员之一Andrej Karpathy表示,“今天,DeepSeek通过一个前沿级LLM的开放权重发布,让这一切看起来轻而易举,而其训练的预算却非常低(2048个GPU运行2个月,总成本600万美元)。”

在硅谷,DeepSeek 还被称作“来自东方的神秘力量”。

DeepSeek 也获得了外国网友的一致好评:

译文:通过DeepSeek V3,中国向美国和欧洲提供了性能最佳的开源模型。谢谢中国!

译文:等等,所以我们现在有一个比 GPT-4o 更好的100%开源模型?!根据多项基准测试,DeepSeek v3 的代码甚至比 Claude Sonnet 3.5 还要优秀。已经免费向所有人开放。

AI“天才少女”刷屏

与DeepSeek一起进入大家视野的,还有95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。

2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称:“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然可能也有运气成分加持。”

硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

本文来自【GoChengdu】,仅代表作者观点。全国党媒信息公共平台提供信息发布及传播服务。

来源:人民日报党媒平台

相关推荐