驯服大模型幻觉!用7B小模型+RAG,提升用户满意度
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
实不相瞒。第一次看到“模型上下文协议”(Model Context Protocol,简称 MCP)这个术语时,我和大多数开发者一样:随便扫了一眼教程,然后就默默跳过了。我当时心想:“太抽象了”。
很多企业要求数据库既要快又要稳,要能轻松搞定海量数据,同时处理超多请求(比如“双 11”抢购秒杀),忙时自动扩容,闲时自动缩水,万一出现 bug 也要迅速恢复,保障业务不中断。传统的集中式单机数据库显然无法同时满足这些需求,和某家云厂商绑定的模式,也可能使得整
别担心!2025 年 7 月 1 日 19:00,ModelWhale 大模型应用平台全新升级,为您答疑解惑!
模型 应用 rag modelwhale 士心 2025-06-26 11:12 2
在当今数字化转型浪潮中,企业对知识管理的需求日益增长,而AI技术的融入为企业知识库的构建带来了新的机遇。本文将深入剖析企业RAG(检索增强生成)知识库项目的全生命周期设计,从项目启动到落地实施,详细解读如何从零开始构建知识库,如何提升知识库的召回率与准确率,以
这项由Yellow.ai公司AI研究团队的Vishesh Tripathi、Tanmay Odapally、Indraneel Das、Uday Allu和Biddwan Ahmed领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2
这项由Yellow.ai公司AI研究团队的Vishesh Tripathi、Tanmay Odapally、Indraneel Das、Uday Allu和Biddwan Ahmed领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2
过去一年,企业对AI的兴趣不减。从接入大模型,到部署RAG(检索增强生成)系统、探索AI Agent,AI从“新技术”变成了“业务工具”的候选项。但一个技术能否真正落地,不取决于愿望强不强,而取决于底层基础是否足够稳。
在上一篇文章中提到,在postgresql中,使用pgvector可以实现向量存储和检索,使用pg_trgm基于三元组文本模糊匹配和相似度计算,结合GIN 索引和GiST索引实现全文检索。但pg_trgm并不是一个专业的中文分词工具,它是基于字符层面的处理,不
模型 机器人 rag postgresql 模型rag 2025-06-22 23:11 2
在大模型盛行的时代,能高效处理海量文档的 RAG(检索增强生成)方案正成为企业的刚需。但现实是:高延迟、高成本、低吞吐,拦住了大多数人。而 Google 最新发布的 Gemini 2.0 Flash,用一次性能的“降维打击”,让 PDF 转文本、并行摄取、快速
本文深入探讨RAPL(Retrieval-Augmented Path Learning)框架,这是一个创新的人工智能架构,通过线图转换和合理化监督技术,从根本上改进了知识图谱环境下的检索增强生成系统。该框架通过构建高效且可泛化的检索器,显著提升了大型语言模型
我之前说过chatGPT的deepresearch 做的好是因为它的DR 引擎是o3强化版本的针对过search场景RFT过,所以体验比grok和google的DR要好,后两者更像deep search或者说我们用的更像deep search
rag llm deepresearch rl ppo 2025-05-11 23:53 5
看完这张图你会发现——只要你会用AI,很多工作已经不需要“人”来做了。
今天为大家介绍一项来自香港大学、北京智源研究院、厦门大学和深圳中文大学研究团队的最新研究成果。这项由香港大学的Nan Huo、Jinyang Li、Ge Qu、Xiaolong Li和Reynold Cheng,北京智源研究院的Bowen Qin,厦门大学的X
各位数据玩家、SQL苦手、AI爱好者们,今天我要给大家安利一个能让你“SQL自由”的神器——Vanna!别看名字像个文艺女青年,实际上它可是MIT开源、Python生态、RAG(检索增强生成)领域的顶流选手,专为SQL自动生成和数据分析而生。你还在为写SQL头
在当今人工智能快速发展的时代,检索增强生成(RAG)系统已成为提升大语言模型事实准确性和实时性的关键技术。然而,这些系统在面对真实世界的各种干扰和变化时,表现得如何呢?卡内基梅隆大学与亚马逊的研究团队近期在这一领域做出了突破性的贡献。2025年6月1日,由卡内
如果说LLM是Agent思考的引擎,那么记忆系统就是赋予它“灵魂”和“经验”的关键。它让Agent能够超越“一次性”的问答机器,成为一个能够持续学习、保持个性化、并从过去经验中汲取智慧的成长型伙伴。
凌晨五点的城市高架桥上,一辆自动驾驶测试车碾过积水路面。系统在毫秒间完成判断:压线变道会违反交规,但保持原路线可能追尾前方故障车。这个瞬间抉择背后,藏着人类司机靠经验积累的"责任感",而AI靠的则是新出炉的ROAD算法——能让机器学会权衡规则与风险的秘密武器。
本文作者分别来自新加坡国立大学、北京大学与清华大学。第一作者王宇豪与共同第一作者屈文杰来自新加坡国立大学,研究方向聚焦于大语言模型中的安全与隐私风险。共同通讯作者为北京大学翟胜方博士,指导教师为新加坡国立大学张嘉恒助理教授。
本研究聚焦于当前广泛应用的 RAG (Retrieval-Augmented Generation) 系统,提出了一种全新的黑盒攻击方法:隐式知识提取攻击 (IKEA)。不同于以往依赖提示注入 (Prompt Injection) 或越狱操作 (Jailbre