构建可靠AI Agent:从提示词、工作流到知识库的实战指南
LLM和工具调用已经形成了相对标准化的技术栈。LLM方面,无论选择云端大模型(如阿里百炼平台、IdeaLab)还是本地部署(如Ollama),都有成熟的解决方案;工具调用方面,MCP协议的普及让工具集成变成了配置问题而非开发问题。因此,业务开发的核心竞争力在于
LLM和工具调用已经形成了相对标准化的技术栈。LLM方面,无论选择云端大模型(如阿里百炼平台、IdeaLab)还是本地部署(如Ollama),都有成熟的解决方案;工具调用方面,MCP协议的普及让工具集成变成了配置问题而非开发问题。因此,业务开发的核心竞争力在于
本文探讨了在云迁移这一复杂且场景多变的领域,为什么标准化工具和方案无法完全替代资深专家,以及如何利用大模型技术来“复制”专家的80%核心能力应对日益增长的项目需求。
这项由南华理工大学的沈文轩、华中科技大学的王明佳、王耀晨、马里兰大学的陈东平等研究人员合作完成的研究发表于2025年8月,论文题目为《我们是否在正确评估文档检索增强生成系统?》。有兴趣深入了解的读者可以通过https://double-bench.github
在AI技术飞速发展的当下,RAG(检索增强生成)作为实用的前沿技术,正助力高效构建高质量知识库。本文深入浅出地解析RAG的定义、优势、技术原理,从知识入库到检索的全流程,并结合公司考勤管理制度实例演示其应用,助你轻松掌握RAG技术,开启知识库建设新篇,快来一探
从需求错配、数据治理,到组织协同与价值衡量,每一步都是坑,也藏着解法。本文聚焦政务大模型落地过程中的 9 个真实问题,结合一线实战经验,拆解背后的机制逻辑与应对策略,为产品人和政务数字化从业者提供一份“避坑指南”与“解法参考”。
在本文中,我会分享一些改进 RAG(检索增强生成)应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术,将系统的召回率从大约 50-60% 一直提高到 95% 及以上。
在人工智能技术飞速发展的今天,大语言模型(LLM)被广泛应用于各种企业场景。然而,随着实际使用的深入,LLM的局限性逐渐显现出来,包括知识幻觉、推理能力不足、信息不精确等问题,无法满足企业对精准性和可靠性的高要求。在此背景下,RAG(检索增强生成)模式应运而生
GPT-5的“平淡”,恰恰不是AI发展的终点,而是宣告了“模型为王”时代的落幕,以及一个以工程、产品和商业化为核心的“应用时代”的它来了。这是AI产业从“上半场”的蛮力竞赛,转向“下半场”精耕细作的标志性发令枪。
人工智能社区痴迷于越来越大的模型、十亿令牌上下文窗口和GPU 的微调运行让人感到厌倦,而人 工智能堆栈中最被忽视的力量倍增器却静静地位于这一切之下的一层: 数据 。
7月24日下午,BPAA第五届应用算法模型实践典范大赛总决赛暨峰会在上海市普陀区成功举办,线上线下观看量超500万人次(本次活动经由新华社现场云、东方财富等多平台直播)。作为世界人工智能大会(WAIC)的重要品牌赛事之一,BPAA也是今年WAIC最早开启的赛事
RAG Chunking TechniquesRetrieval-Augmented Generation(RAG)很大程度上取决于你怎么分块数据。 想让LLM检索到真正有意义的上下文?你得用心设计数据的分块方式。
模型 rag llm bob generation 2025-08-05 00:06 3
抖音作为日活数亿的平台来讲,要想满足用户体验可想而知具有多么大的挑战。在7月25-26日深圳举办的DA数智技术大会上,我们邀请了字节跳动算法专家蔡聪怀老师,他从事AI算法多年,在内容理解、体验智能化等业务场景有丰富的落地经验。届时他将分享大模型助力抖音用户体验
实不相瞒。第一次看到“模型上下文协议”(Model Context Protocol,简称 MCP)这个术语时,我和大多数开发者一样:随便扫了一眼教程,然后就默默跳过了。我当时心想:“太抽象了”。
很多企业要求数据库既要快又要稳,要能轻松搞定海量数据,同时处理超多请求(比如“双 11”抢购秒杀),忙时自动扩容,闲时自动缩水,万一出现 bug 也要迅速恢复,保障业务不中断。传统的集中式单机数据库显然无法同时满足这些需求,和某家云厂商绑定的模式,也可能使得整
别担心!2025 年 7 月 1 日 19:00,ModelWhale 大模型应用平台全新升级,为您答疑解惑!
模型 应用 rag modelwhale 士心 2025-06-26 11:12 7
在当今数字化转型浪潮中,企业对知识管理的需求日益增长,而AI技术的融入为企业知识库的构建带来了新的机遇。本文将深入剖析企业RAG(检索增强生成)知识库项目的全生命周期设计,从项目启动到落地实施,详细解读如何从零开始构建知识库,如何提升知识库的召回率与准确率,以
这项由Yellow.ai公司AI研究团队的Vishesh Tripathi、Tanmay Odapally、Indraneel Das、Uday Allu和Biddwan Ahmed领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2
这项由Yellow.ai公司AI研究团队的Vishesh Tripathi、Tanmay Odapally、Indraneel Das、Uday Allu和Biddwan Ahmed领导的研究发表于2025年6月的arXiv预印本平台,论文编号为arXiv:2
过去一年,企业对AI的兴趣不减。从接入大模型,到部署RAG(检索增强生成)系统、探索AI Agent,AI从“新技术”变成了“业务工具”的候选项。但一个技术能否真正落地,不取决于愿望强不强,而取决于底层基础是否足够稳。
在上一篇文章中提到,在postgresql中,使用pgvector可以实现向量存储和检索,使用pg_trgm基于三元组文本模糊匹配和相似度计算,结合GIN 索引和GiST索引实现全文检索。但pg_trgm并不是一个专业的中文分词工具,它是基于字符层面的处理,不
模型 机器人 rag postgresql 模型rag 2025-06-22 23:11 7