返回 编程开发

展开

可可软件园> 应用软件> 编程开发

Milvus(矢量数据库)

大小:5.9M时间:2021-06-07 09:40:59 类别:编程开发系统:WinAll
简介|教程
软件介绍

Milvus是一个开源的矢量数据库,它易于使用,实用可靠,易于扩展,稳定高效,搜索快捷。它提供了一套简单直观的API,允许您针对不同的场景选择不同的索引类型。常用于媒体、文本搜索、新药搜索、基因筛选等领域。欢迎下载使用!

软件特色

综合相似指数

Milvus支持多种常用的相似度计算指标,包括欧氏距离、内积、汉明距离和Jaccard距离。可以根据应用需求选择最有效的向量相似度计算方法。

行业领先的性能

Milvus是基于高度优化的近似最近邻搜索(ANNS)索引数据库,包括faiss、惹恼、hnswlib等。您可以为不同的使用场景选择不同的索引类型。

动态数据管理

您可以随时插入、删除、搜索和更新数据,而不受静态数据的干扰。

近实时搜索

插入或更新数据后,您几乎可以立即搜索插入或更新的数据。Milvus负责确保搜索结果的准确性和数据的一致性。

高成本效益

Milvus充分利用现代处理器的并行计算能力,可以在一台通用服务器上以毫秒为单位搜索十亿级数据。

支持多种数据类型和高级搜索

Milvus数据记录中的字段支持多种数据类型。您还可以对一个或多个字段使用高级搜索,如筛选、排序和聚合。

高可扩展性和可靠性

您可以在分布式环境中部署Milvus。如果您想扩展容量或提高集群的可靠性,只需添加节点。

云原生

您可以在公共云、私有云或混合云上轻松运行Milvus。

使用方便

Milvus提供了易于使用的Python、Java、Go和C SDK,还提供了RESTful API。

主要特性

异构计算

优化了基于GPU的矢量搜索和索引构建性能。

对TB数据的毫秒级搜索可以在单个通用服务器上完成。

动态数据管理。

支持主流索引库、距离计算方法和监控工具

向量索引库如Faiss、NMSLIB、惹恼等都是集成的。

支持基于量化的索引、基于图形的索引和基于树的索引。

相似度计算方法包括欧氏距离(L2)、内积(IP)、汉明距离、提花距离等。

普罗米修斯作为监控和性能指标的存储方案,Grafana作为显示数据的可视化组件。

近实时搜索

默认情况下,可以在1秒钟后搜索插入Milvus的数据。

标量场过滤(即将上线)

支持向量和标量数据。

标量数据可以被过滤以增强搜索的灵活性。

更新日志

新功能

#4564支持在get_entity_by_id()方法调用中指定分区。

#4806支持在delete_entity_by_id()方法的调用中指定分区。

#4905添加release_collection()方法从缓存中卸载特定的集合。

改进

#4756提高了get_entity_by_id()方法调用的性能。

#4856将hnswlib升级到v0.5.0

#4958提高试管婴儿指数训练的性能。

已修复问题

#4778无法访问Mishards中的向量索引。

#4797合并不同topK参数的搜索请求后,系统返回错误结果。

#4838服务器不会立即响应空集合上的索引构建请求。

#4858对于支持图形处理器的Milvus,当有大型topK的搜索请求时,系统会崩溃(2048)。

#4862只读节点在启动期间合并片段。

#4894布隆过滤器的容量不等于其段的行数。

#4908放弃一个集合后,GPU缓存未被清除。

#4933系统索引一小段需要很长时间。

#4952未能将时区设置为“utc5336030”。

#5008在连续并发的删除、插入、搜索操作中,系统随机崩溃。

#5010对于支持图形处理器的Milvus,如果nbits8,则体外受精_PQ查询失败。

#5050 get_collection_stats()为仍在索引过程中的段返回错误的索引类型。

#5063当一个空段被刷新时,系统崩溃。

#5078对于支持图形处理器的Milvus,当在2048、4096或8192维的向量上创建试管婴儿索引时,系统崩溃。

加载全部内容

热门推荐
推荐教程
猜你喜欢
相关合集
本类排行