模态模型

阿里巴巴盘前涨超1% 发布通义千问系列的最新旗舰模型Qwen2.5-Omni

消息面上,北京时间周四凌晨,阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。这款端到端多模态模型专为广泛的多模态感知设计,能够处理文本、图像、音频和视频等多种输入,同时能够通过生成文本和合成语音提供实时流式响应。模型性能方面,Qwen2.5-O

模型 模态 音频 模态模型 阿里巴巴 2025-03-27 18:58  1

大模型和具身智能究竟是什么关系?

具身智能与大模型频频被提及,但具身智能 = 机器人 + 大模型吗?本文摘自北京邮电大学人工智能学院副教授陈光(@爱可可-爱生活)的新书《走进具身智能》,作者很明确地表示,大模型虽然是实现具身智能的重要工具,但并不是其全部。当前,包括英伟达、智源、智元等多家机构

模型 模态 智能 模态模型 人机交互 2025-03-27 14:42  1

DeepSeek 多模态模型

昨天还看到有人拉踩 deepseek v3 的时候说 deepseekv3 缺少多模态能力,除夕 deepseek 就发了 Janus-Pro, 一个7B 的多模态模型,可以进行多模态理解和生成。

模型 模态 模态模型 2025-02-06 20:51  6

认识下 Ivy-VL:一种仅包含 30 亿个边缘设备参数的轻量级多模态模型

随着人工智能(AI)技术的快速发展,一个长期存在的挑战愈发凸显:如何在模型规模、效率和性能之间找到平衡。传统上,模型越大,性能往往越强,但这也意味着对计算资源的要求更高,使得AI技术在广泛应用时面临障碍,尤其对于缺乏高端计算设备的组织和个人来说更是如此。而多模

模态 模态模型 轻量级 2025-01-10 09:58  10

李飞飞团队统一动作与语言,新的多模态模型超懂指令,能读懂隐含情绪

人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。

模型 模态 模态模型 2024-12-18 18:21  9