GPT-5发布,普通人必看的8件事
一个名字统一所有模型、幻觉率骤降 80%、API 成本腰斩、编程小白也能 5 分钟做 APP……还有官方 PPT 的低级图表乌龙和“紫色气泡卖 20 美元”的黑色幽默。读完这篇 5 分钟速览,你就能判断:GPT-5 到底是革命还是挤牙膏,以及它下一秒怎么替你打
一个名字统一所有模型、幻觉率骤降 80%、API 成本腰斩、编程小白也能 5 分钟做 APP……还有官方 PPT 的低级图表乌龙和“紫色气泡卖 20 美元”的黑色幽默。读完这篇 5 分钟速览,你就能判断:GPT-5 到底是革命还是挤牙膏,以及它下一秒怎么替你打
时间回到6年前,同样是8月,美国会员制超市Costco(开市客)在上海开出中国内地首店,开业当天就因客流量过大而暂停营业。这也让国内的零售品牌们看到中产消费的潜力,用当下的时髦话来表达,可以称之为一种经济上行期的美。
当青少年 AIGC 工具生成 “恐龙在唐朝被人类驯养” 的插画,当 AI 写出 “李白发明了活字印刷术” 的作文素材,这些看似 “有理有据” 的内容,其实是 AI 制造的 “幻觉陷阱”。青少年 AIGC 就像一个聪明却记性不好的学霸,常常把知识碎片乱拼,输出看
GPT-5今天凌晨终于发布了,官方肯定是在继续吹模型的性能了,但从市场的反应上看感觉比较一般,毕竟并没有出现大家期待的智能程度上有非常大的迭代升级,甚至有的点还输给了Grok4,马斯克还专门发了推特,diss了一波。。
其实,关于生死这事儿,家家都有说不完的经验和传说。可真轮到自家门口,你再理性、再见多识广,有时候还是得服气。你说,这世上是不是总有点玩不明白的小把戏,等着咱们摸不着头脑?
因发布了一篇关于“董明珠言论帖”,深圳的小程(化名)被起诉了。据报道,格力公司方面表示,董明珠并没有发表“想双休的人,拿不到高薪,更不值得培养”等言论,小程所发内容纯属捏造,且已实际引发公众对格力公司及其产品的抵制言论和负面评价,其行为已造成对格力公司名誉权的
OpenAI 称 GPT - 5 在回答健康相关问题时表现更出色,在衡量 AI 模型健康主题回应准确性的测试 “HealthBench Hard Hallucinations” 中,GPT - 5(启用思考功能时)幻觉率仅为 1.6%,远低于该公司此前的 GP
傍晚五点四十五分,暮色刚爬上防城港的屋檐。两辆汽车在狭窄乡道顶头相遇,车窗摇下的瞬间,时间被拉成细长的橡皮筋。争吵、喇叭、尘土,所有声音混作一团。下一秒,一本暗红色封皮的“行政执法证”被甩到对方面前,封皮在夕阳里像滴血。五秒钟后,证件收回,车门重重合上;七十二
8月1日下午,国家互联网信息办公室、国家发展和改革委员会、工业和信息化部、公安部四部门联合发布了一项针对面向公众的大模型的新规,旨在进一步规范人工智能技术的应用,保障公众权益和社会安全。新规要求,所有面向公众的大模型在上线前必须通过“三级等保+红队+水印”三道
模型 水印 幻觉 安全策略 国家互联网信息办公室 2025-08-07 02:24 4
这项由斯坦福大学、北阿拉巴马大学等多所院校组成的国际研究团队完成的研究,发表于2024年。研究主要作者Amit Das来自北阿拉巴马大学,团队成员分布在威奇塔州立大学、默里州立大学、加州州立理工大学波莫纳分校、奥本大学、古斯塔夫阿道夫学院等多个机构,还包括来自
8月2日,丹东凤凰山景区一名51岁游客坐老牛背栏杆后仰坠亡,妻子目睹惨剧。事发地峭壁险峻,护栏高约1米,其高度是否合规引争议——虽无景区专项标准,但参照民用建筑规范,24 米以上临空处栏杆应不低于1.1 米。调查称坠亡或与拍照有关,家属已报警。景区安全巡检、风
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
63岁的张姨攥着第三次退婚协议,在社区活动室的长椅上坐了整晚。窗外的广场舞音乐声里,她突然想起年轻时外婆说的老话:"老来伴,是药也是刀"——这半生三次搭伙尝试,让她彻底看清了晚年婚恋的残酷真相。
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。西安交通大学研究团队提出了一种名为Nullu的方法,通过提取「幻觉子空间」(HalluSpace)并进行零空间投影来编辑模型权重,从而有效消除幻觉,且不增加额外推理成本。
投影 图像 幻觉 cvpr halluspace 2025-06-27 20:21 8
当前大型视觉语言模型(LVLMs)存在物体幻觉问题,即会生成图像中不存在的物体描述。西安交通大学研究团队提出了一种名为Nullu的方法,通过提取「幻觉子空间」(HalluSpace)并进行零空间投影来编辑模型权重,从而有效消除幻觉,且不增加额外推理成本。
投影 图像 幻觉 零空间 halluspace 2025-06-27 15:12 7
当ChatGPT为律师编造不存在的判例,当医疗AI将皮疹诊断为“恶性病变”,当历史问答中“林黛玉倒拔垂杨柳”被引为史实——这些看似荒诞的场景,正是当前AI技术最棘手的痼疾:幻觉(Hallucination)。据中国信通院调研,42.2%的用户遭遇过AI生成内容
心灵之路的奇迹在于,就算你对它无热情,无尊重,无打算,无期待,无意愿,觉得不配,觉得没准备,也总是会在不经意间偶然发现宝藏。——克拉丽莎·平科拉·埃斯特斯
多模态推理模型真的「越想越明白」吗?研究表明,R1系列模型在推理链条加长的过程中,其视觉感知能力出现下降趋势,生成内容有时会偏离图像本身,出现「看见」不存在事物的幻觉现象。推理能力的提升,在一定程度伴随着视觉对齐的弱化,呈现出「越推理越幻觉」的倾向。这一现象引
长期以来,大型语言模型的"幻觉"问题被视为人工智能技术的阿喀琉斯之踵——它们会凭空编造事实、产生不存在的信息,让无数研究者为之头疼。然而,来自剑桥大学的最新研究却颠覆了这一认知:在科学研究领域,AI的"幻觉"可能正是创新的源泉,能够帮助科学家发现前所未有的治疗
在科幻电影中,人工智能常被塑造成全知全能的“超级大脑”,但现实中,AI却时常表现为“自信的谎言家”。比如,请AI描述“关公战秦琼”,它不仅能“叙述”虚构的故事情节,还会“猜测”用户喜好,煞有介事地编造不存在的文献档案。这种现象被称为“AI幻觉”,已经成为困扰许