MVP 聚技站|推理检索增强(RRAG)—对传统 RAG 的增强优化
在当前的大型语言模型(LLM)实践中,我们面临着许多挑战,因为 LLM 目前的局限性和无法低成本的融合外部知识,因此在企业实践时,我们需要通过外部数据库将企业知识和大模型进行连接。目前的主流方案是我们尝试将企业文档存储在向量库中,然后通过检索相关的 chunk
在当前的大型语言模型(LLM)实践中,我们面临着许多挑战,因为 LLM 目前的局限性和无法低成本的融合外部知识,因此在企业实践时,我们需要通过外部数据库将企业知识和大模型进行连接。目前的主流方案是我们尝试将企业文档存储在向量库中,然后通过检索相关的 chunk
"为什么我的RAG效果这么差?" "又在为知识库准确率发愁?" "找到好的开源方案了吗?"作为一个技术博主,我理解大家的焦虑。但是,很多人忽略了问题:你的核心知识真的都在网上吗?事实是,很多最有价值的知识,往往躺在那些积灰的档案袋里 - 技术手册、项目总结、研
很显然,现在对于 agent Memory 的研究是极其匮乏的,调研了现在所有的文献以及开源仓库,我稍微做一下总结。当然,其实不仅仅是 memory,所谓的 memory 其实包含了 knowledge,他是一个所有信息存储的综合。也就是说,RAG 这种信息检
rag agent workflow agentmemory 2025-03-30 01:08 1
前面我已经花了很长时间通过Dify等各种开发平台来搭建自己的RAG系统。总想通过自己的程序的来实现,了解它背后的实现原理。最近半个月就一直在研究此事,总算能运行成功了。
作为全球领先的物联网整体解决方案供应商,移远通信凭借深厚的技术积累与前瞻性的战略布局,在AI大模型端侧部署的赛道上率先发力,其端侧AI大模型解决方案备受瞩目,为AI设备的革新注入了澎湃动力。
在过去一年里大模型领域主要有两大领域的热点,一个是 LLM,几乎每月速度革新,大家关心的是效果和成本。另一个是 AI Agent,大家尝试解决各个领域应用问题,大家关心的是场景和竞争力。下面我们重点分享一下 AI Agent 的趋势和实践。
大模型从技术到实际应用之间仍存在一定的距离,这一距离正是通过RAG和Agent技术来弥合,这不仅解决了大模型落地的“最后一公里”问题,还为多Agent协同、智能数据治理、金融风控、运维自动化等领域提供了新的解决方案。
周四去深圳市政府见一个客户A,说是技术交流,但是提问的是个不懂技术的领导,当我们开始说技术实现相关细节时,就被打断,最后接受了一堆需求。其实这个活应该售前去,毕竟是吹牛逼大会,做技术的都比较现实一些,能做我会说一定完成,不一定能做的就不会乱说,导致客户说我们技
它是由 Deluxer 团队开发并在 GitHub 上开源的语音 RAG 助手。能实时处理你的语音指令,从 Qdrant 数据库中检索信息并生成回答。
最近在做 RAG (Retrieval-Augmented Generation) 相关项目时,发现一个挺头疼的问题:嵌入模型太多了,到底选哪个好呢? 尤其是在处理中文和英文时,选择就更困难了。
数据(Data):原始符号,比如菜谱中的“五花肉500克”“豆瓣酱20克”“小火炖煮30分钟”——这些是未经处理的文字或数字。信息(Information):结构化后的数据,比如提取出“回锅肉”的食材(五花肉、豆瓣酱、青蒜)、烹饪步骤(煮→切片→炒)和口味标签
在数字浪潮汹涌澎湃的当下,人工智能(AI)已深度融入我们的生活,从智能助手到内容创作,从医疗诊断到金融分析,AI的身影无处不在。然而,随着AI技术的飞速发展,一个令人揪心的问题也浮出水面——AI幻觉。这种现象不仅挑战着我们对信息真实性的认知,还可能在不经意间颠
在信息爆炸的时代,如何快速获取准确、专业的知识成为许多人面临的难题。本文将介绍腾讯推出的IMA(腾讯AI工作台),它通过集成RAG架构,实现了基于用户自定义知识库的智能检索与回答,让知识管理更加高效、精准。
首先我们需要解决一个问题,就是在本地的ragflow和dify的页面默认的访问端口是有冲突的(用的都是80和443端口)。
本文围绕直播团队在过去半年中基于AI技术在工程侧提效的探索展开,详细介绍了服务端、前端、数据科学、测试和数据研发等职能团队如何结合AI能力进行创新尝试。文章不仅总结了现阶段取得的阶段性成果,还深入分析了AI能力的优势与局限性,例如文本生成的涌现能力、固定思维过
2025年是行业公认的“大模型的成本年”。年初不到3个月,先有DeepSeek-R1开源,引爆行业价格战,后就有通义千问QwQ-32B深夜发布,引领极致性价比。QwQ-32B不仅以320亿参数跑赢6710亿参数的DeepSeek-R1满血版,更实现了消费级显卡
从你在 AI 大模型的对话框里发送了一句话,到大模型给你回复答案的这个过程,经历了什么?
想象你是一个厨师,但只会做固定的几道菜(比如大模型的预训练知识)。当客人点一道新菜(用户提问)时,你可能不知道怎么做。这时,如果你能快速查阅一本最新的菜谱(外部知识库),就能做出更准确的菜(回答)。
日常常见接触到的文件格式有doc、pdf、excel 等文件格式,这些不同文件格式的文件其中内容有文本、表格、图像夹杂其中。其中文字内容的读取重要的是保留其中板式,文字内容的读取一般各种python库基本能支持;
今日前沿的几个重要 AI 动态和工具。核心主题之一是中国最新的通用 AI 代理系统Manus AI及其开源替代方案OpenManus。Manus AI 由中国初创公司 Monica 开发,是一种能够自主“思考、规划并执行任务”的智能代理,被誉为当前最先进的 A