摘要:DB-GPT是由蚂蚁集团发起的开源AI原生数据应用开发框架(AI Native Data App Development framework with AWEL(Agentic Workflow Expression Language) and Agents)
DB-GPT是由蚂蚁集团发起的开源AI原生数据应用开发框架(AI Native Data App Development framework with AWEL(Agentic Workflow Expression Language) and Agents),旨在通过大语言模型(LLM)技术革新数据库交互方式,提升数据管理与分析的效率与安全性。项目于2024年9月发布新版本v0.6.0,并在“星辰智能社区”推动下快速发展,目前GitHub Star数已超1.7万,社区活跃用户近7,000人,贡献者达130人,覆盖蚂蚁、阿里、美团等科技公司及高校研究人员。
目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,解决大模型与数据库交互中的幻觉问题、数据隐私安全及开发复杂性,助力开发者高效构建AI原生数据应用。
github官网上有详细的安装部署介绍,有多种部署模式,这里介绍最简单的Docker-compose模式:
1、缺少text2vec-base-chinese模型问题
傻傻按官方介绍安装是运行不起来的,docker desktop后台可以看到报错信息,缺少text2vec-base-chinese模型
需要手动下载:https://huggingface.co/shibing624/text2vec-base-chinese
下载以下必要文件: config.json pytorch_model.bin special_tokens_map.json tokenizer_config.json tokenizer.json vocab.txt
然后放置在电脑上特定目录,比如D:/tools/models,然后在docker-compose.yml文件中制定models路径
2、数据库切换问题
虽然 MySQL 数据库中已经创建了 gpts_app 表,但是应用程序仍然在尝试使用 SQLite 数据库。这是因为环境配置的问题。
3、默认大模型加载需要KEY问题
默认加载的是硅基流动的配置dbgpt-proxy-siliconflow-mysql.toml
需要输入正确的 SILICONFLOW_API_KEY。 访问 SiliconFlow 官网获取 API Key 将获取到的 API Key 替换到 .env 文件中的 your_api_key_here
4、切换本地大模型,如DeepSeek的问题
举例如ollama方式,ip地址需要从127.0.0.1切换为下图所示:
5、连接mysql数据问题
将数据库主机从 localhost 改为 db(Docker 容器名称)
chatdata提问(基于示例数据库case_2_ecom):
提问:不同国家的顾客购买能力对比分析
生成质量还是比较nice的!
注意事项:
DB-GPT 的名字在开源社区中并非独一无二,清华大学数据库组也有一个同名项目https://github.com/TsinghuaDatabaseGroup/DB-GPT,专注于数据库诊断系统(D-Bot)。
来源:大狗zg一点号