Milvus 是什么

Milvus 是什么

Milvus 是一款开源向量相似度搜索引擎，建立在 Faiss、NMSLIB、Annoy 等向量索引库基础之上，具有功能强大、稳定可靠以及易于使用等特点。Milvus 集成了这些向量索引库，隐藏了他们的复杂性，提供了一套简单而一致的 API。此外，Milvus 能够有效的管理向量数据，提供针对向量和非向量数据的增删改查的能力。除了提供针对向量的近实时搜索能力外，Milvus 可以对标量数据进行过滤。随着数据和查询规模的增加，Milvus 还提供了集群分片的解决方案，支持读写分离、水平扩展、动态扩容等功能，实现了对于超大数据规模的支持。目前，Milvus 是一个单节点主从式架构（Client-server model）的服务器，最高可以支持 TB 级特征数据的存储和搜索服务。对于有更大数据规模或者高并发需求的用户，可以使用目前尚在实验阶段的集群分片中间件 Mishards 进行部署。

在服务端，Milvus 由两部分组成：Milvus server 和 Meta store。

Milvus server 提供了 Milvus 的主要功能，包括数据的存储与管理、数据的搜索等。
Meta store 则存储了 Milvus 的元数据。目前 Milvus 支持的元数据库可以是 MySQL 和 SQLite。

这些能力使得 Milvus 可以广泛地应用于以下场景：

图像、视频、音频等音视频搜索领域
文本搜索、推荐和交互式问答系统等文本搜索领域
新药搜索、基因筛选等生物医药领域

除了提供核心的数据管理和搜索功能外，Milvus 还提供了

基于 JSON 的 DSL，提供用户灵活方便的搜索方式
基于 Python / Java / Go / C++ 的 SDK 和 RESTful API
对接基于 Prometheus 的监控与告警系统
基于 Docker和 Kubernetes 的部署方式

以上功能都极大地增强了 Milvus 的易用性。

Milvus 是开箱即用的产品，所有配置参数都有默认值。因此对初学者来说使用体验非常友好。随着深入了解 Milvus，你会发现整个 Milvus 都是灵活可配置的。你可以利用 Milvus 的高级特性来优化向量的存储与搜索，更好地服务于你的业务。

Milvus 在 Apache 2 License 协议下发布，于 2019 年 10 月正式开源，是 LF AI 基金会的孵化项目。Milvus 的源代码被托管于 Github 之上：Milvus · 开源的特征向量相似度搜索引擎。如果你想加入我们的开发者社区，欢迎访问：Contribute to Milvus。

如果你对 Milvus 有任何与功能、SDK 等相关的问题，欢迎加入 Slack 参与讨论。