摘要:o1 完整版本:这个版本在多个方面实现了突破性进展,包括更智能、更快的响应速度、多模态输入能力(能够处理图像和文本信息),以及在指令遵循方面的表现更好。o1 在重大错误率上降低了约 34%,思考速度提升了约 50%。o1 模型现在能够同时处理图像和文本进行推理
随着凌晨第十二天的 o3 模型的发布,OpenAI 连续 12 天的 AI 发布会结束了。下面回顾下这十二天都发布了些啥。
在 OpenAI 的第一天发布会上,主要发布了两个重要的更新:o1 的完整版本和 ChatGPT Pro 订阅服务。
1、o1 完整版本:这个版本在多个方面实现了突破性进展,包括更智能、更快的响应速度、多模态输入能力(能够处理图像和文本信息),以及在指令遵循方面的表现更好。o1 在重大错误率上降低了约 34%,思考速度提升了约 50%。o1 模型现在能够同时处理图像和文本进行推理,这为视觉相关的应用开辟了广阔的应用前景。
2、ChatGPT Pro:这是一个高级订阅服务,每月收费 200 美元,提供了无限访问 OpenAI 最先进的模型 o1,以及 o1-mini、GPT-4 o 和 Advanced Voice 等功能。特别引人注目的是 o1 Pro 模式,这是 o1 的一个高阶版本,利用更强大的计算资源,深度分析问题并为最复杂的问题提供更优解答。
用户价值:
提升效率和准确性:o1 的升级版为用户提供了更快、更准确的服务,尤其在复杂问题的处理上,减少了错误率,提高了思考速度。
多模态能力:多模态输入的支持使得 o1 能够处理更多样化的任务,如图像分析和图文结合的创作等。
专业级服务:ChatGPT Pro 为高需求用户提供了更强大的功能和更稳定的服务,适合在数学、编程等领域需要极致性能的用户。
o1 完整版本需要 Plus 用户才能体验,ChatGPT Pro 对个人来说太贵了,况且那些高级推理能力一般人也用不上。
重点介绍了「强化微调(Reinforcement Fine-Tuning)」技术。
强化微调技术:这项技术允许用户在极少的训练数据基础上,创建特定领域的专家模型。通过强化学习的理念,这一技术使得模型具备更自主的推理能力,并在各项指标上显著提升。强化微调能力可以让小体量模型「从高中水平跃升至专家水平」,预计将在 2025 年春季开放给用户。
用户价值:
定制化 AI 应用:强化微调技术使得企业或科研单位能够根据特定需求,快速训练出专家级别的 AI 模型,提升了定制化 AI 应用的可能性和效率。
OpenAI 发布了备受期待的 Sora 视频产品。
Sora 视频产品:Sora 支持生成 1080p 高清视频,并提供多种视频编辑智能功能,如替换元素、最佳帧隔离等,减少了视频创作的门槛。Sora 提供了文本转视频、图像转视频和视频转视频功能,并配备了精美的分镜工具,让用户精准指导视频创作。
用户价值:
视频创作民主化:Sora 的发布极大地降低了视频创作的技术门槛,使得普通用户也能创作出专业级别的视频内容。
创意表达工具:Sora 为创意人员提供了强大的工具,帮助他们更好地表达自己的想法和创意,推动了内容创作的创新。
最近看了檀东东的一个海螺和 Sora 对比评测视频,感觉 Sora 有点拉胯,对不起那么贵的价格。
OpenAI 为 Canvas 推出了三项重大更新,这些更新使得 Canvas 更加强大,为用户提供了全新的使用体验。
1、Canvas 全面开放与主模型集成:OpenAI 将 Canvas 面向所有用户开放,并直接将其整合到主模型中,免去了额外的加载步骤。用户可以直接从首页的输入框跳转到 Canvas,进行文档编辑和创作。
2、Python 代码实时执行能力:Canvas 集成了一个 Web Assembly 的 Python 模拟器,允许用户直接在 Canvas 中运行 Python 代码,并实时查看文本或图形输出。这个环境不仅能够实时运行与反馈代码,还能智能报错提醒和提供代码建议,极大地提高了编程效率。
3、Canvas 与自定义 GPT 的深度整合:新创建的自定义 GPT 将默认启用 Canvas 功能,而现有自定义 GPT 可以通过简单设置启用这项功能。这标志着 OpenAI 在构建 AI 应用生态系统上迈出了关键一步,有望催生出一个比传统应用商店更具创新活力的 AI 应用市场。
用户价值:
提高效率:Canvas 的更新使得文档编辑、代码编写和团队协作更加高效,尤其是实时代码执行和错误反馈功能,为程序员提供了即时的编程辅助。
增强协作:通过集成评论系统和版本对比功能,Canvas 优化了团队协作体验,使得团队成员的互动更加自然和高效。
扩展应用场景:Canvas 与自定义 GPT 的整合为开发者提供了更灵活的创作空间,降低了 AI 应用开发的门槛,加速了专业领域 AI 解决方案的落地。
这个功能还比较良心,向全部用户开放。
OpenAI 宣布了 ChatGPT 与苹果 iOS、iPadOS 和 macOS 系统的集成,允许用户在操作系统中直接访问 ChatGPT 的功能。
ChatGPT 集成到苹果系统:用户可以通过唤醒 Siri 来直接使用 ChatGPT 的功能。
用户价值:
便捷访问:集成到苹果系统中,使得用户可以更自然、更便捷地在更多场景中使用 ChatGPT。
提升体验:通过 Siri 的集成,ChatGPT 的交互变得更加直观和易于访问,提升了用户体验。
OpenAI 宣布了高级语音模式的重大升级,其中最引人注目的是视频聊天功能的加入。
1、视频聊天功能:用户可以通过智能手机摄像头与 ChatGPT 进行视频聊天,ChatGPT 能够理解用户的连续性动作以及记住相关信息,为用户提供实时的指导和帮助。
2、屏幕共享:用户可以将自己的屏幕分享给 ChatGPT,ChatGPT 能识别设备屏幕显示的物体和内容,并据此为用户提供相应的帮助和解答。
用户价值:
多模态交互:视频聊天和屏幕共享功能的加入,使得 ChatGPT 能够提供更加自然、直观的交流方式,增强了用户体验。
实时指导:通过视频聊天,ChatGPT 可以实时指导用户解决具体问题,如冲泡咖啡等,为用户提供了实际的帮助。
提高沟通效率:屏幕共享功能使得 ChatGPT 可以更直接地参与到用户的工作中,帮助用户解决技术问题,提高沟通和工作效率。
OpenAI 推出了名为「Projects」的新功能,这是一个旨在提高用户工作效率和项目管理能力的工具。
1、Projects 功能:Projects 允许用户上传文件、设置自定义指令,并在一个 Project 中组织所有对话。这个功能类似于 GPT,但主要的区别在于它能够将所有相关的对话和文件整合在一起,方便用户管理和跟踪项目进展。
2、文件上传与自定义指令:用户可以上传各种格式的文件,如 TXT、PDF、Word 文档、PPT 幻灯片和 Excel 电子表格等,ChatGPT 会阅读文件内容后回复用户。同时,用户可以为特定项目设置自定义指令,使 AI 更好地理解和执行项目相关的任务。
3、对话组织与管理:Projects 功能还允许用户将现有会话加入到 Project 中,使得项目管理更加集中和高效。
用户价值:
提高项目管理效率:通过整合文件和对话,Projects 功能帮助用户更有效地管理和跟踪项目进展。
增强协作能力:Projects 功能支持团队协作,使得团队成员可以共享文件和讨论,提高团队协作的效率。
定制化工作流程:用户可以根据自己的工作流程设置自定义指令,使 AI 更好地适应特定的工作需求。
这个功能应该值得充一个 Plus 。
OpenAI 宣布了 ChatGPT 搜索功能的三大更新,这些更新旨在提升用户体验和搜索功能的实用性。
1、搜索性能提升:OpenAI 提升了搜索性能,特别是在移动端,使得搜索更快、更便捷。
2、地图体验加入:搜索功能中加入了地图体验,用户可以更加直观地获取地理位置相关信息。
3、全球免费开放:搜索功能现在向全球所有登录用户免费开放,用户可以通过语音对话获取实时网络信息。
用户价值:
提升搜索效率:性能的提升和地图体验的加入,使得用户能够更快地找到所需信息。
实时信息获取:通过语音对话获取实时网络信息,提高了信息获取的便捷性和实时性。
全球用户覆盖:全球免费开放使得更多用户能够享受到 ChatGPT 的搜索服务。
不过 AI 搜索在国内是标配了。
在第九天的发布会上,OpenAI 主要针对开发者群体,推出了多个 API 相关更新,特别是 o1 API 的正式版本。
1、o1 API 正式版本:这个版本不仅速度更快、成本更低,还加入了视觉识别、函数调用等新功能,使得开发者能够更轻松地构建各类应用。
2、计算资源节省:o1 API 正式版本比之前的版本节省了 60% 的计算资源,这意味着开发者可以用更低的成本获得更好的性能。
3、WebRTC 支持:OpenAI 通过引入 WebRTC 支持,极大简化了实时语音应用的开发流程,现在开发者只需要 12 行代码就能构建基础的语音交互功能。
4、价格下调:相关服务的价格大幅下调,其中 GPT-4o 的音频处理费用降低了 60%,使得更多开发者有机会尝试语音应用开发。
用户价值:
降低开发成本:o1 API 的正式版本和价格下调,使得开发者能够以更低的成本构建和部署 AI 应用。
提升开发效率:新功能的加入和 WebRTC 的支持,简化了开发流程,提高了开发效率。
增强应用性能:节省计算资源和提升性能,使得应用能够提供更好的用户体验。
OpenAI 宣布了通过电话和 WhatsApp 使用 ChatGPT 的新功能。这意味着用户可以通过最基础的电话功能或 WhatsApp 与最先进的 AI 进行对话,号码是 1-800-CHAT-GPT,或者是 1-800-242-8478。支持智能手机,老人机和座机等设备。极大地降低了使用门槛。
电话接入:美国用户可以拨打 1-800-CHAT-GPT(即 1-800-242-8478),通过语音与 ChatGPT 对话。每月可免费通话 15 分钟。
WhatsApp 集成:全球用户可以在 WhatsApp 上添加上述号码为联系人,与 ChatGPT 进行文本交流。这是 OpenAI 首次将 ChatGPT 集成到 WhatsApp 平台,且该服务完全免费。
简单易用:不需要注册账号,不需要记住密码,只需要像打电话一样简单操作。
跨设备支持:从最新款的 iPhone 到老式的翻盖机,都能直接和 AI 对话。
多语言支持:ChatGPT 能够提供多语言服务,如教用户用西班牙语交流。
用不上。
OpenAI 宣布了 ChatGPT 与 Mac 应用的深度集成,特别在编程和写作方面进行了更新。现在,用户可以通过简单的复制粘贴操作,与 Warp、Xcode 等应用协同工作,无需详细交流即可执行任务。此外,ChatGPT 还支持在语音模式下与 Notion、Apple Notes 等应用协同工作。这些新功能已在 Mac 最新版 ChatGPT 应用中推出,而 Windows 用户还需等待。
桌面应用全新升级:ChatGPT 桌面应用支持与多种应用程序协同工作,包括开发工具和文档编辑工具。通过 ChatGPT 分析 Git 提交数据并生成可视化图表。
实时演示与 Warp 终端、Xcode IDE 的智能协作:展示了 ChatGPT 如何与开发环境无缝协作,为编程任务提供实时支持。在 Xcode 中实现代码自动补全和功能添加。
对 Notion、Apple Notes、Quip 等写作工具的支持:这些功能现已在 Mac 桌面应用上线,Windows 用户需等待。
高级语音交互模式:通过语音模式与 ChatGPT 交谈,提供了更加自然和高效的体验。
搜索辅助功能:确保输出信息的准确性,结合搜索功能来优化写作内容。
Mac 一直没升级,用不上。
今天凌晨的发布会上,OpenAI 发布了 o3 模型及其精简版 o3-mini。这标志着 OpenAI 在 AI 模型开发上的又一大步,o3 模型在性能上比前代模型有显著提升,而 o3-mini 则提供了一个更轻便的选择,以适应不同的使用场景和需求。
为什么从 o1 直接到了 o3,是因为跟英国电信服务提供商 O2 可能存在版权或商标冲突,就直接用了 o3。
目前不知道 o3 什么时候放出,但可以在下面地址进行申请:
个人最期待的是第二天的强化微调用到第七天的 Project 功能上,然后使用 o3 模型,打造最强个人 AI 知识库。
来源:opendotnet