摘要:开源向量数据库Milvus公司Zilliz近期发布Milvus 2.5,其中包括对混合向量和关键字搜索功能的强大改进,处理查询的速度比传统解决方案快30倍,同时不需要单独的向量和关键字搜索系统。Milvus 2.5现已推出,标志着在各种规模的组织使用复杂的人工
开源向量数据库Milvus公司Zilliz近期发布Milvus 2.5,其中包括对混合向量和关键字搜索功能的强大改进,处理查询的速度比传统解决方案快30倍,同时不需要单独的向量和关键字搜索系统。Milvus 2.5现已推出,标志着在各种规模的组织使用复杂的人工智能搜索方面取得了重大进展。
传统上,实施混合搜索的组织被迫维护两个独立的系统——一个用于语义搜索,另一个用于关键字搜索——这导致了重复的基础设施、复杂的集成和运营成本的增加。Milvus 2.5通过一种创新的方法解决了这一挑战,该方法将这两种功能统一在一个高性能平台中。
Zilliz的创始人兼首席执行官Charles Xie表示:“我们正在见证组织在搜索方式上的根本转变。”“借助Milvus 2.5,我们不仅仅是将两种搜索方法结合在一起——我们正在用一种速度快30倍的解决方案彻底改变企业搜索,同时大大简化了基础设施。这将改变构建人工智能应用程序的组织的游戏规则。”
Zilliz是一家领先的矢量数据库公司,由创建Milvus的工程师创立,Milvus是世界上应用最广泛的开源矢量数据库。Zilliz的下一代数据库技术帮助组织快速创建人工智能(AI)/机器学习(ML)应用程序,并释放非结构化数据的潜力。
无与伦比的速度和性能
Milvus 2.5利用了Sparse-BM25技术,这是Elasticsearch和其他全文关键字搜索系统使用的BM25算法的稀疏向量实现。这种混合矢量关键字搜索方法产生了压倒性的结果;Elasticsearch有100万个向量,在完全托管的Elastic Cloud上测试时需要200毫秒,而Milvus 2.5在完全托管Zilliz Cloud上返回搜索结果只需要6毫秒。这意味着性能提高了30倍以上。与基本的混合实现不同,即使文档集合随着时间的推移而增长和变化,Milvus 2.5也能保持高准确性,自动适应任何行业或领域的新术语和专业词汇。
Milvus 2.5的混合搜索提供了以下好处:
统一基础设施:管理一个系统而不是两个系统可以最大限度地降低操作复杂性,同时节省组织的时间和资源,包括更少的上下文切换和不需要掌握两组不同的API。
智能查询处理:一个请求可以执行语义和全文搜索任务,消除了对不同系统的两个不同的API调用。
整合数据管理:统一的表结构将密集(基于向量)和稀疏(基于关键字)数据与共享元数据标签一起存储,而不是使用两个单独的系统并存储两次元数据标签。
增强的安全性和访问控制:只需管理一个系统,所有访问控制都集中管理,加强了安全合规性和一致性。
来源:龚龚科技杂谈