摘要:OpenAI的未发布模型「ChatGPT ε」意外泄露,可能是「猎户座」模型,引发广泛讨论;
生成式AI
一、 OpenAI下一代模型泄露!「半GPT-5」旗舰模型猎户座要来了?
1. OpenAI的未发布模型「ChatGPT ε」意外泄露,可能是「猎户座」模型,引发广泛讨论;
2. 猎户座模型的性能提升不如从GPT-3到GPT-4,可能不会被命名为GPT-5;
3. OpenAI正在开发新方法应对高质量数据供应减少,预计明年初完成Orion的安全测试,可能改变「GPT」命名惯例.
二、 OpenAI Day 4 Canvas重大升级!跑代码改bug界面大革新
1. Canvas升级增强了写作和编辑功能,支持修改建议、语法检查、添加表情等;
2. 引入Python代码运行功能,支持调试代码并实时查看输出和错误修正;
3. Canvas集成至自定义GPTs,用户可以为特定任务定制AI,提升工作效率。
三、 一觉睡醒,AI码农同事Devin已经正式上线了,月薪3500
1. AI编程助手Devin已正式发布,能够理解需求并编写、修改代码,包括修复bug和重构代码;
2. Devin支持Slack集成、IDE扩展和API接口,适用于工程团队,月费500美元起;
3. Devin已参与多个开源项目的贡献,展示其在实际应用中的强大能力。
四、 Niantic的AI 3D建模神器登陆Quest,3D生成UGC要来了
1. Niantic推出AI 3D建模平台Scaniverse,旨在通过全球用户生成3D场景,打造最大UGC社区;
2. 新增Meta Quest平台支持,用户可在虚拟现实中探索、查看和上传3D场景,促进全球3D地图的建设;
3. 采用高斯溅射技术提升扫描质量,支持更快的实时反馈与扫描分享,推动增强现实和虚拟现实体验的开发。
五、 DeepMind发布PaliGemma二代,最易微调「视觉语言全能王」
1. PaliGemma 2在图像描述、乐谱识别、医学报告生成等任务上取得SOTA成绩,并提供多种尺寸和分辨率版本;
2. 模型增强了视觉能力,易于微调,适用于OCR、分子结构、放射学等任务;
3. 通过提高分辨率和模型尺寸,PaliGemma 2在任务表现上显著提升,尤其在文本检测和放射报告生成中表现突出。
六、 清华系 AI 公司面壁智能新一轮融资,端侧智能进入持久战
1. 面壁智能完成数亿元融资,将加速端侧AI大模型商业化,提升性能与能效;
2. MiniCPM系列突破性进展,已成为开源社区明星项目,广泛应用于消费电子和垂直行业;
3. 同时关注在法律、教育等垂直领域的深度赋能,推动大模型在行业场景中的落地与应用。
七、 视觉中国与Vidu达成战略合作,共拓视觉产业大模型应用
1. 视觉中国与生数科技合作,打造视觉产业大模型平台,推动AI在视觉内容行业的应用;
2. 视觉中国提供丰富的版权合规视觉资源,生数科技提供多模态大模型技术,共同支持内容创作者;
3. 双方计划拓展国内B端市场和海外个人用户业务,提升AI视频生成解决方案和创作工具的市场竞争力。
八、 港中文「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
1. 多模态大模型如GPT-4o在音频感知上存在明显短板,无法正确分辨简单的音量差异;
2. 香港中文大学等发布的AV-Odyssey基准测试揭示,现有模型在26个视听任务中的表现接近随机猜测,GPT-4o的准确率仅为34.5%;
3. 研究推出DeafTest和AV-Odyssey测试工具,旨在提升多模态大模型的音频和视觉整合能力,特别是音频理解方面的不足。
前沿科技
九、 Apple Watch Ultra 3 将支持通过卫星连接发送离网短信
1. 2025年发布的Apple Watch Ultra 3将支持卫星连接功能;
2. 用户可在没有蜂窝网络和Wi-Fi时通过卫星发送短信,首次支持向任何人发送离网短信;
3. 卫星连接功能将提升Apple Watch Ultra的安全性,特别适用于徒步旅行、潜水和探险等户外活动。
报告观点
十、 2024年诺贝尔物理学奖得主Hopfield和Hinton最新演讲
1. 2024年诺贝尔物理学奖得主Hopfield和Hinton在瑞典发表演讲,分享他们的科研经历与神经网络理论;
2.Hopfield讲述了物理学对理解人类和世界的重要性,Hinton介绍了Hopfield网络和玻尔兹曼机的发展,以及神经网络的学习机制;
3. 计算机科学家Jürgen Schmidhuber指控Hopfield和Hinton的工作剽窃了早期研究者的成果,引发争议。
来源:腾讯研究院