Skip to content

向量索引

yuyang edited this page Dec 15, 2022 · 7 revisions

向量检索是指将图片或者内容等以向量的形式表达,并建立向量索引库,查询时支持输入一个或多个向量来根据向量距离返回topK个近似结果。
问天引擎深度集成了proxima核心库,使问天引擎具有了向量检索的能力。问天引擎的向量索引支持图索引、聚类索引等多种主流的向量索引类型,并具有高性能、低成本的特点。以hnsw索引为例,在sift 1M和deep 10M公开测试集上,使用16core 64G的机器,问天引擎的向量索引可以达到数千qps和10ms以内的延迟。同时问天引擎的向量索引可以采用非全内存的模式加载,从而可以大大减少了对机器内存的开销,提升单机索引规模,降低机器成本。

向量检索的示例请参考向量示例。可以再运行镜像里面通过执行下面的命令镜像测试。

python build_demo_data.py /ha3_install/ vector
python start_demo_searcher.py /ha3_install/ vector

对于编译镜像,需要重新编译代码之后才可以执行上述命令,在执行上述命令时注意问天引擎的安装目录可能不同。

Clone this wiki locally