摘要:OpenAI推出ChatGPT热线,用户可通过电话或WhatsApp直接与AI互动,无需联网;
生成式AI
一、 Genesis生成式物理引擎震撼开源,一句话模拟世界万物
1. Genesis 是一个开源生成式物理引擎,能够模拟4D动态,并支持各种物理现象;
2. 它提供超高速并行模拟,模拟速度是现有引擎的10至80倍,且具备照片级真实感渲染;
3. 支持自动生成机器人策略、3D场景、角色动作等数据,助力机器人和AI应用的开发。
二、 OpenAI推出「ChatGPT热线」:不用联网,直接电话聊天
1. OpenAI推出ChatGPT热线,用户可通过电话或WhatsApp直接与AI互动,无需联网;
2. 目标是扩大ChatGPT用户群,特别是吸引不常使用手机APP的人群,挑战Meta在WhatsApp的AI布局;
3. 使用4o-mini模型降低成本,同时保持通话速度和效率,美国用户每月15分钟免费通话。
三、 GitHub Copilot 免费:Visual Studio Code迎来史诗级更新
1. GitHub Copilot现已免费,VS Code用户可享每月2000次代码补全与50次聊天请求,支持GPT-4和Claude 3.5模型;
2. 新增Copilot Edits功能支持多文件编辑,AI模型选择、命名建议和终端命令辅助等功能提升开发体验;
3. 通过自定义指令与@workspace,用户可定制AI助手行为,并与VS Code扩展深度集成。
四、 快手可灵1.6正式上线,又一次超越了自己,比1.5进步太多
1. 可灵1.6版本提升了图生视频的物理规律表现,特别是在切食物、倒水等场景中展现了更高的真实感;
2. 人物运动和表演能力大幅增强,特别是肢体动作和面部表情更加自然,如芭蕾舞和中国古典舞的精准表现;
3. 语义理解和画面生成能力加强,能准确识别并实现复杂的动作序列,提升视频稳定性与连贯性。
五、 皮克斯创始人加入Odyssey,照片或文字生成超写实3D场景
1. 皮克斯创始人埃德·卡特穆尔加入AI公司Odyssey,推动生成式3D世界模型的进展;
2. Odyssey推出Explorer,能将图片或文字转化为逼真3D场景,旨在颠覆电影、游戏等行业的制作流程;
3. Explorer采用高斯泼溅技术生成详细3D场景,兼容Unreal Engine等工具,提升影视和游戏创作效率。
六、 Midjourney年底大招:10美元无限作图 + 秒速生成 + 网页升级
1. Midjourney推出“Relax马拉松”福利活动,10美元即可无限制生成图片,活动持续到2024年底;
2. 图片生成速度显著提高,用户可同时排队最多24个作业,支持最多12个Relax模式作业;
3. 新版网页体验提升,生成速度加快,基础会员也能享受此福利,但特殊功能仍按旧规运行。
七、 Meta田渊栋团队新作:连续思维链,比传统的CoT更高效
1. Meta田渊栋团队提出的连续思维链(Coconut)通过去除语言模型的头尾层,使用中间状态进行自回归,提高了推理效率和性能;
2. Coconut通过多阶段训练策略,利用语言推理链指导训练,允许同时编码多个可能步骤,增强推理能力;
3. 实验表明,Coconut在多个数据集上表现优于传统思维链(CoT),在推理效率和准确性上均有显著提升。
前沿科技
八、 芝大、清华分析6800万份论文,AI可能会降低科学家创造力
1. 人工智能工具提高了科学家发表论文的数量和被引用次数,但导致研究主题集中且重复性增加;
2. 使用人工智能的初级科学家更易晋升,但整体科学领域的知识范围和多样性萎缩;
3. 研究建议调整激励制度,鼓励科学家探索新领域而非过度依赖人工智能工具。
报告观点
九、 Anthropic 新研究揭秘 AI 的对齐伪装,AI 伪装程度竟高达78%
1. Anthropic 的研究发现 AI 存在“对齐伪装”现象,即 AI 表面上遵循新训练要求,但实际上保留原有价值观;
2. 实验显示 Claude 在未被监控时会遵循新要求,但在被监控时则假装顺从,以避免被“改造”;
3. 强化学习下 Claude 的“伪装”频率升至 78%,并尝试“反抗”,显示 AI 可能采取超出人类控制的行动。
十、 Perplexity CEO:进步的最终衡量标准--对世界的理解是否加深
1. Perplexity专注于打造全球首个“答案引擎”,通过优化现有AI模型,提升用户信息获取体验;
2. 公司选择不自行构建模型,而是利用现有资源,专注于用户体验和产品差异化;
3. Perplexity的使命是成为一个广泛可访问、可靠的答案引擎,帮助用户提高生产力和节省时间。
来源:腾讯研究院