吉林大学团队:首创多模态AI错误识别评估框架
这项由吉林大学人工智能学院杨海琪、李金哲、李庚旭、常毅、吴元等研究者完成的重要研究,发表于2025年8月6日的计算机视觉领域权威期刊,探索了一个关乎AI安全性的关键问题。感兴趣的读者可以通过arXiv:2508.04017v1访问完整论文,研究代码已在GitH
这项由吉林大学人工智能学院杨海琪、李金哲、李庚旭、常毅、吴元等研究者完成的重要研究,发表于2025年8月6日的计算机视觉领域权威期刊,探索了一个关乎AI安全性的关键问题。感兴趣的读者可以通过arXiv:2508.04017v1访问完整论文,研究代码已在GitH
在AI技术日新月异的今天,如何有效评测大模型性能成为测试工程师面临的新挑战。本文将带您深入探索构建AI测试平台的实战过程,分享多模态模型评测的关键技术与设计思路。
国家知识产权局信息显示,浙江研煌科技有限公司申请一项名为“一种基于多模态大模型的数字人视频生成方法”的专利,公开号CN120472059A,申请日期为2025年04月。
该智能体支持语音、文本多模态交互,其语音系统由双方联合研发,覆盖唤醒、识别、理解、播报全链路,应用全双工技术实现随时打断交互,并具备复杂声学环境抗回声能力。系统整合高德导航专用ASR模型、通用大模型ASR及综合理解模型,覆盖导航、本地生活及日常对话场景。
微信公众号2024年12月6日发布,视觉中国宣布与国内知名短视频社交平台——北京快手科技有限公司(以下简称“快手科技”)达成战略合作协议,双方将共同研发和部署人工智能多模态大模型,以科技创新为驱动力,共同赋能视觉内容的创作与价值变现,引领行业进入智能化新时代。
OpenGithub社区:https://open.itc.cn/Github : https://github.com/OpenGithubs>>搜索开源推荐官头条社区: >>搜索开源推荐官知乎社区: >>搜索Open Github社区订阅榜单: >>Git
与GPT-3到GPT-4的惊艳跨越相比,GPT-5的发布略显匆忙:翻车的数据图表、带bug的代码演示、误导的“博士级”科学原理解释,以及作为核心技术更新的“Router”(路由器)也被硅谷AI从业者指出是已经存在好几年的技术。
今天,CMU 博士生、英伟达 GEAR(通用具身智能体研究)团队成员 Tairan He(何泰然)向 GPT-5 询问了这个问题,结果模型回答错了。
2025年8月8日,OpenAI重磅推出GPT-5,这一消息瞬间点燃了全球科技爱好者的热情,也让整个AI行业为之一震。
近年,人工智能(AI)正成为驱动智能手机行业创新与变革的核心引擎。8月7日,三星在北京举办了“Galaxy Z系列AI体验官”活动,展示了其最新一代折叠屏旗舰手机——Galaxy Z Fold7与Galaxy Z Flip7,及其搭载的创新Galaxy AI与
“2025世界机器人大会”于8月8日至12日在北京经济技术开发区开幕,“AI 大模型赋能机器人与具身智能产业新范式交流活动”作为2025世界机器人大会的专题活动于8月8日同期召开。自变量机器人创始人兼CEO王潜出席并演讲。
7 月 27 日,腾讯发布了具身智能开放平台 Tairos,以模块化的方式向行业提供大模型、开发工具和数据服务,试图为具身智能的研发和应用提供一套通用的支撑体系。
近日,博时特科技强势推出了一款商显智慧终端——AI数字人智能交互一体机。该款AI数字人智能交互一体机拥有人脸识别、语音互动、触控查询、导览解说、迎宾接待、业务办理等多功能服务模块,可以实现多模态交互、智能问答、场景化服务等功能。在客服、信息传播、教育、文旅等多
当马斯克高调宣称Grok4"碾压所有研究生"时,OpenAI的GPT-4o却用实际表现给了当头一棒!这场科技巨头的AI对决,胜负早已藏在用户体验的细节里...
近期OpenAI发布GPT-5,引发资本市场关注。该模型推理能力进步明显,不仅在通用场景测试中得分较前代旗舰模型o3提升明显,而且在幻觉测试中错误率最低降低至0.7%;定价与Gemini 2.5 Pro等主流模型持平,性价比显著提升。而在垂类场景如编程和医疗上
但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点、到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。
2025年8月7日,OpenAI正式发布GPT-5系列模型,该模型在编码、数学、写作、健康、视觉感知等领域的性能均实现显著突破,同时通过智能路由架构和深度推理模块大幅提升了可靠性。GPT-5被定位为OpenAI首个“统一”人工智能系统,整合了基础模型的效率与深
国家知识产权局信息显示,武汉理工数字传播工程有限公司申请一项名为“一种基于多模态的声音生成方法”的专利,公开号CN120452412A,申请日期为2025年05月。
这项由Skywork AI多模态团队完成的研究发表于2025年8月,展示了他们开发的Skywork UniPic模型的卓越能力。有兴趣深入了解的读者可以通过GitHub(https://github.com/SkyworkAI/UniPic)和HuggingF
华为智选车产品总监(享界系列)彭磊今日发文介绍鸿蒙智行享界 S9T 旅行车产品信息第七弹:智能底盘 & 途灵平台。据称,享界 S9T 旅行车一大“爆点”是全系满配空气悬架 + 连续可变阻尼减震器 CDC + 双叉臂前悬 + 多连杆后悬 + 华为途灵平台 3.0