AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

摘要：欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、腾讯开源具备原生3D重建能力的超长程世界模型：HunyuanWorld-Voyager

腾讯发布的HunyuanWorld-Voyager是一种创新的视频扩散框架，能够基于单张输入图像生成具有世界一致性的3D点云，并支持沉浸式探索。该模型在视频生成质量和场景重建效果上表现出色，展现了其在AI驱动的VR、游戏和仿真空间智能领域的潜力。

【AiBase提要:】

🌍 HunyuanWorld-Voyager能基于单张输入图像生成具有世界一致性的3D点云，支持用户沉浸式探索。

🎥 模型同时生成精确对齐的深度信息和RGB视频，适用于高质量三维重建。

🏆 在多个测试中，HunyuanWorld-Voyager在视频生成质量和场景重建效果上均优于其他模型。

2、通义实验室推出新一代智能体开发框架AgentScope 1.0

通义实验室推出的AgentScope 1.0是一个专注于多智能体开发的开源框架，提供全生命周期解决方案，包括开发、部署和监控。其三层技术架构（核心框架、Runtime和Studio）支持独立使用，具备实时介入控制、智能上下文管理和高效工具调用三大能力，确保了智能体的安全性和运行效率。

【AiBase提要:】

🌟 AgentScope 1.0是新一代智能体开发框架，专注于多智能体的开发，提供全生命周期解决方案。

🚀 具备实时介入控制、智能上下文管理和高效工具调用三大能力，提高智能体的开发和运行效率。

🔒 AgentScope Runtime 提供安全的工具沙箱和高效的部署运行引擎，确保智能体的安全与稳定。

详情链接:https://github.com/agentscope-ai/agentscope

3、即梦AI系列模型开放API，为开发者提供一站式图像与视频生成服务

即梦AI与火山引擎全面开放API服务，为企业提供强大的图像和视频生成能力，助力创意转化为现实。

【AiBase提要:】

🎨 文生图3.0、文生图3.1等模型开放API服务，助力企业高效生成图像和视频内容。

🎬 视频生成3.0pro与动作模仿DreaMactor M1等模型支持多样化的创作需求。

💼 即梦AI通过火山引擎赋能企业级市场，推动商业应用的创新发展。

4、腾讯开源翻译巨头 Hunyuan-MT-7B：斩获 WMT2025 三十项冠军，翻译界的新霸主！

腾讯推出的 Hunyuan-MT-7B 在 WMT2025 中表现卓越，成为翻译领域的佼佼者，展现了其在多语言处理上的强大实力，并通过开源方式推动技术的广泛应用和发展。

【AiBase提要:】

🧪 Hunyuan-MT-7B 在 WMT2025 中斩获 30 个语种的第一名，展现强大的翻译能力。

🌐 支持 31 种语言，包括多种小众语言，体现腾讯在自然语言处理领域的技术积累。

🚀 开源模式推动技术发展，助力全球交流与合作。

5、苹果推出 STARFlow：全新 AI 图像生成技术想力压 DALL-E 与 Midjourney

苹果公司推出的 STARFlow AI 图像生成系统在技术上实现了突破，结合了正则化流和自回归变换器，提高了高分辨率图像生成的效率和质量。该系统通过深浅设计和潜在空间操作优化模型性能，并且与学术机构合作推动 AI 技术的发展。

【AiBase提要:】

🧠 STARFlow 结合正则化流和自回归变换器，提升图像生成效率。

💡 通过深浅设计和潜在空间操作优化模型表现。

🚀 苹果与学术机构合作推动 AI 技术发展，未来应用前景广阔。

详情链接:https://arxiv.org/pdf/2506.06276

6、苹果 FastVLM 上线:5分钟体验85倍速视觉 AI，数据永不出设备

苹果推出的 FastVLM 视觉语言模型现已向公众开放，基于 Apple Silicon 芯片的 Mac 可直接体验。FastVLM 在视频字幕处理速度上提升了85倍，同时体积缩小了3倍以上，支持在浏览器中加载轻量级版本，无需复杂安装过程。其本地化运行设计确保数据永不离开设备，为隐私保护提供了理想解决方案。

【AiBase提要:】

🍎 FastVLM 提供近乎即时高分辨率图像处理能力，提升视频字幕处理速度85倍。

💻 支持在浏览器中加载轻量级版本，无需复杂安装即可体验强大功能。

🔒 数据完全在本地运行，确保隐私安全且支持离线使用。

7、新模型 CoMPaSS-FLUX.1：提升Flux文本到图像生成的空间理解能力

CoMPaSS-FLUX.1是一种基于 FLUX.1 文本到图像扩散模型的 LoRA 适配器，旨在显著提升生成图像时对物体空间关系的理解能力。该模型在多个基准测试中表现出色，特别是在处理物体之间的空间关系方面取得了显著进展。