驯服大模型幻觉!用7B小模型+RAG,提升用户满意度
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
63岁的张姨攥着第三次退婚协议,在社区活动室的长椅上坐了整晚。窗外的广场舞音乐声里,她突然想起年轻时外婆说的老话:"老来伴,是药也是刀"——这半生三次搭伙尝试,让她彻底看清了晚年婚恋的残酷真相。
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。西安交通大学研究团队提出了一种名为Nullu的方法,通过提取「幻觉子空间」(HalluSpace)并进行零空间投影来编辑模型权重,从而有效消除幻觉,且不增加额外推理成本。
投影 图像 幻觉 cvpr halluspace 2025-06-27 20:21 2
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。西安交通大学研究团队提出了一种名为Nullu的方法,通过提取「幻觉子空间」(HalluSpace)并进行零空间投影来编辑模型权重,从而有效消除幻觉,且不增加额外推理成本。
投影 图像 幻觉 零空间 halluspace 2025-06-27 15:12 2
当ChatGPT为律师编造不存在的判例,当医疗AI将皮疹诊断为“恶性病变”,当历史问答中“林黛玉倒拔垂杨柳”被引为史实——这些看似荒诞的场景,正是当前AI技术最棘手的痼疾:幻觉(Hallucination)。据中国信通院调研,42.2%的用户遭遇过AI生成内容
心灵之路的奇迹在于,就算你对它无热情,无尊重,无打算,无期待,无意愿,觉得不配,觉得没准备,也总是会在不经意间偶然发现宝藏。——克拉丽莎·平科拉·埃斯特斯
多模态推理模型真的「越想越明白」吗?研究表明,R1系列模型在推理链条加长的过程中,其视觉感知能力出现下降趋势,生成内容有时会偏离图像本身,出现「看见」不存在事物的幻觉现象。推理能力的提升,在一定程度伴随着视觉对齐的弱化,呈现出「越推理越幻觉」的倾向。这一现象引
长期以来,大型语言模型的"幻觉"问题被视为人工智能技术的阿喀琉斯之踵——它们会凭空编造事实、产生不存在的信息,让无数研究者为之头疼。然而,来自剑桥大学的最新研究却颠覆了这一认知:在科学研究领域,AI的"幻觉"可能正是创新的源泉,能够帮助科学家发现前所未有的治疗
在科幻电影中,人工智能常被塑造成全知全能的“超级大脑”,但现实中,AI却时常表现为“自信的谎言家”。比如,请AI描述“关公战秦琼”,它不仅能“叙述”虚构的故事情节,还会“猜测”用户喜好,煞有介事地编造不存在的文献档案。这种现象被称为“AI幻觉”,已经成为困扰许
高考结束了,学子们为自己十多年的寒窗苦读给出了一个交代。但紧接着他们将要奔赴第二战场——高考志愿填报。俗话说三分考七分报,志愿填报重要性一点也不亚于高考本身。
在科幻电影中,人工智能常被塑造成全知全能的“超级大脑”,但现实中,AI却时常表现为“自信的谎言家”。比如,请AI描述“关公战秦琼”,它不仅能“叙述”虚构的故事情节,还会“猜测”用户喜好,煞有介事地编造不存在的文献档案。这种现象被称为“AI幻觉”,已经成为困扰许
基于大语言模型(LLM)驱动的Agent系统,尤其是多Agent系统,具备处理复杂、多步骤任务以及与不同环境实时互动的能力,在软件工程、药物发现等诸多领域得到了广泛应用。然而,现实却给这一充满潜力的技术泼了一盆冷水。相比于单个 agent 系统甚至更简单的 b
她觉得只要把我塞进“全国著名天才训练营”,就能像炒股一样,搏一个未来可期。她的思路很简单:别人都在跑,我家孩子不能走。
海法港的夜色浓重如墨。两名以色列公民在悄无声息中被辛贝特特工带走,指认的罪名是为伊朗执行情报任务。然而当辛贝特突袭搜查时,那些关乎国家命脉的文件早已消失无踪——伊朗伊斯兰共和国广播电视台(IRIB)的报道揭示了一个令人心悸的事实:就在抓捕行动前,涉及以色列战略
海法港的夜色浓重如墨。两名以色列公民在悄无声息中被辛贝特特工带走,指认的罪名是为伊朗执行情报任务。然而当辛贝特突袭搜查时,那些关乎国家命脉的文件早已消失无踪——伊朗伊斯兰共和国广播电视台(IRIB)的报道揭示了一个令人心悸的事实:就在抓捕行动前,涉及以色列战略
点赞分享有用内容,功德无量~思念如风,看不见却吹得人眼眶发红;回忆似雨,摸不着却淋得心头潮湿。这世上最磨人的,莫过于分开后那些细碎的感觉,它们像散落的珠子,一颗颗滚进生活的缝隙里,白天藏在忙碌背后,夜里却硌得人辗转难眠。有人问,怎样才算真正爱过?是轰轰烈烈的誓
患者,女,72岁,蒙古族,农民,体重:70kg,身高:160cm,BMI:27.3kg/m2(超重)
你知道AI也会犯错吗?你知道它也会有算错题、说假话、逻辑混乱等“幻觉”吗?你觉得大模型有偏见吗?你认为它是否维护伦理,是否中立,是否公平?近日,在2025上海科技节期间举办的第四届上海科技传播大会上,上海交通大学媒体与传播学院发布了一项聚焦生成式人工智能发展与
你知道AI也会犯错吗?你知道它也会有算错题、说假话、逻辑混乱等“幻觉”吗?你觉得大模型有偏见吗?你认为它是否维护伦理,是否中立,是否公平?近日,在2025上海科技节期间举办的第四届上海科技传播大会上,上海交通大学媒体与传播学院发布了一项聚焦生成式人工智能发展与
当央行逆回购公告弹出屏幕的时刻,许多散户或许已经本能地屏住呼吸,手指悬停在“卖出”按键的上方。这种如同巴甫洛夫实验中那只听见铃声便流出唾液的狗一般的反应,早已深植于市场的潜意识中——逆回购一出,股市必遭重创,宛如无可挣脱的宿命链条。