rag

驯服大模型幻觉!用7B小模型+RAG,提升用户满意度

抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验

模型 模态 rag 幻觉 dpo 2025-06-28 13:00  2

数据库厂商入局AI又有新思路,OceanBase选择“卖铲子”

很多企业要求数据库既要快又要稳,要能轻松搞定海量数据,同时处理超多请求(比如“双 11”抢购秒杀),忙时自动扩容,闲时自动缩水,万一出现 bug 也要迅速恢复,保障业务不中断。传统的集中式单机数据库显然无法同时满足这些需求,和某家云厂商绑定的模式,也可能使得整

rag ob 向量 数据库 oceanbase 2025-06-26 14:33  2

一篇看懂:企业RAG知识库项目的全生命周期设计(纯干货)

在当今数字化转型浪潮中,企业对知识管理的需求日益增长,而AI技术的融入为企业知识库的构建带来了新的机遇。本文将深入剖析企业RAG(检索增强生成)知识库项目的全生命周期设计,从项目启动到落地实施,详细解读如何从零开始构建知识库,如何提升知识库的召回率与准确率,以

知识库 rag llm 企业rag rag知识库 2025-06-26 10:29  2

使用 Gemini 2.0 Flash 对数百万个文档进行摄取和 RAG

在大模型盛行的时代,能高效处理海量文档的 RAG(检索增强生成)方案正成为企业的刚需。但现实是:高延迟、高成本、低吞吐,拦住了大多数人。而 Google 最新发布的 Gemini 2.0 Flash,用一次性能的“降维打击”,让 PDF 转文本、并行摄取、快速

gemini rag text flash idx 2025-06-21 13:58  3

RL+search = Deep research

我之前说过chatGPT的deepresearch 做的好是因为它的DR 引擎是o3强化版本的针对过search场景RFT过,所以体验比grok和google的DR要好,后两者更像deep search或者说我们用的更像deep search

rag llm deepresearch rl ppo 2025-05-11 23:53  5

卡内基梅隆大学团队:如何全面检测RAG系统鲁棒性?

在当今人工智能快速发展的时代,检索增强生成(RAG)系统已成为提升大语言模型事实准确性和实时性的关键技术。然而,这些系统在面对真实世界的各种干扰和变化时,表现得如何呢?卡内基梅隆大学与亚马逊的研究团队近期在这一领域做出了突破性的贡献。2025年6月1日,由卡内

rag 卡内基 梅隆 rag系统 检测rag 2025-06-07 21:28  5

打造真正AI Agent的三大利器

如果说LLM是Agent思考的引擎,那么记忆系统就是赋予它“灵魂”和“经验”的关键。它让Agent能够超越“一次性”的问答机器,成为一个能够持续学习、保持个性化、并从过去经验中汲取智慧的成长型伙伴。

智能体 rag llm agent 长期记忆 2025-04-10 22:58  4

自动驾驶AI怎么懂责任?新方法用交规知识图谱

凌晨五点的城市高架桥上,一辆自动驾驶测试车碾过积水路面。系统在毫秒间完成判断:压线变道会违反交规,但保持原路线可能追尾前方故障车。这个瞬间抉择背后,藏着人类司机靠经验积累的"责任感",而AI靠的则是新出炉的ROAD算法——能让机器学会权衡规则与风险的秘密武器。

方法 rag 交规 dmv 北京五环路 2025-06-06 00:40  5