摘要:o3 是什么?包括在使用 ChatGPT 和 cursor 的时候,在可选的模型列表中,也可以看到类似 4o 的身影OpenAI 发布的 LLM 不是 gpt3、4、5吗?这些小写字母o 是什么?
早上在IT之家看到一则简讯,Altman 发推特说,计划几周内推出 o3 mini 推理模型
o3 是什么?包括在使用 ChatGPT 和 cursor 的时候,在可选的模型列表中,也可以看到类似 4o 的身影OpenAI 发布的 LLM 不是 gpt3、4、5吗?这些小写字母o 是什么?
带着这样的问题,我想梳理一下 OpenAI 的时间线,如果你有相同的困惑,可以继续看下去
2015.12.10 OpenAI在旧金山成立,创始人除了现在的老板 Sam Altman,还有现任美利坚御史大夫 Elon Musk。
不过后来 Musk 辞去了董事会席位,因为特斯拉的自动驾驶AI研发存在利益冲突。后来OpenAI转变经营模式开始盈利,Musk开始公开批评 OpenAI,闹出了很多beef,然后自己转身创办了 xAI 和 neuralink 等公司,在业务方向上存在着一定的重叠
另外一个值得一提的创始人是 Ilya Sutskever。2012年,有一个三人小组,构建了一个 AlexNet 的神经网络,在李飞飞举办的 ImageNet 比赛中夺冠。
这件事意义非凡,第一它引发了深度学习复兴,向当时的主流证明了神经网络在处理大规模图像数据集的能力和效率。第二,它训练使用的不是传统实验室那种昂贵而庞大的CPU集群,而是面向游戏消费者的NVIDIA的GPU,后面的事情大家都知道了。
而Ilya Sutskever 就是三人小组之一
2016年,OpenAI 发布 OpenAi Gym 的公测版,这是一个强化学习研究的平台。
同年发布 Universe,也是个训练AI的软件平台
2018年,发布 GPT-1,这是个 LLM,具有1.17亿参数
2019年11月,发布 GPT-2,参数上升到了 15 亿。这个时候开始,抱上了微软的大腿,微软宣布,要对其投资10亿刀乐
2020年6月,发布 GPT-3,参数指数上升到 1750亿,这时,模型已经具备了自然语音问答的能力。于是 OpenAI 开始确定了自己的商业化套路:卖 API
2021年,推出 Codex,这是一个基于垂直领域训练的模型,用8亿行代码训练出来的,60亿参数,为 Github Copilot 提供了技术支持。
Github 早在 18年就被微软全资收购,基于上面的关系,这个模型可以理解为是 OpenAI 交付的 KA 需求。
刚推出的时候,当时还是觉得有帮助的,可能是基于首次体验到副驾驶coding的惊奇。现在用了cursor,体验过@Symbol的context & index 能力,再用 Copilot,只能说太屑了,只会添乱
2022年9月21日,开源了 Whisper,这是一个用于语音识别的神经网络值得注意的是,直到此刻,OpenAI 还没有发布任何基于AI的应用型产品,之前提到的,都只是LLM。因此,在这个时间点前,这家公司只会被相关企业或技术圈子注意,并没有进入普罗大众的视野,直到...
2022年11月30日,ChatGPT它来了,随即引发全球的广泛关注。就算你不知道怎么下载安装,你也躲不开自媒体对其能力铺天盖地的渲染,李一舟AI靠卖课发了家,海外也传出某女星基于自己人格的虚拟女友大赚特赚,基于LLM的生成式AI正式进入了整个世界
2023年3月14日,GPT-4发布,并应用到了 ChatGPT Plus 中。这里避免新同学弄混,在理清一下:GPT 是LLM,ChatGPT 是应用。同时,微软也推出了 new bing,正是基于 GPT-4,可惜对中国用户防范甚是严格,修改vpn节点还是频繁被封
2024年5月14日,GPT-4o发布,可实时进行音频、视觉和文本推理,相比 GPT-4 Turbo,价格下降 50%,速度上升 200%。(论性价比,还是国产的 deepseek,效果和性能也不输 gpt 和 claude )
2024年9月12日,发布 o1,其中包含 o1-preview 和 o1-mini两个版本。它和前辈相比,不同在于,使用了全新的优化算法、特定的训练数据集,因此在coding和解决多步骤问题这些方面表现更好
。而 preview 和 mini 的区分,是为了差异化应对客户需求,mini偏向个人,preview适用科研或企业
紧接着在 2024年12月21日,推出 o3 和 o3-mini,被称为最强推理模型。在 ARC-AGI 测试中正确率达到 87.5%,在 CodeForces 编程竞赛平台上拿到 2727 分,位居全球第 175 位,在 Frontier Math 测试中能解决 25.2% 的问题。o3-mini 是其轻量版,速度更快、成本更低,在资源受限的场景中也能展现强大推理能力。
不过还没对外,这就回到了文章开头,Altman 提及的将在几周内推出 o3-mini的消息
至此,openai这家公司到底推出了哪些大模型,我们就厘清了,也解答了文章开头的问题。感谢阅读。对AI感兴趣的同学,可以持续关注这个栏目,让我们一起学习AI
#AI
来源:叶大隐