全部產品
Search
文件中心

:Proxima Builder

更新時間:Jul 13, 2024

LinearBuilder

參數名

類型

預設值

說明

proxima.linear.builder.column_major_order

string

false

構建的時候特徵用行排(false)/列排(true)

QcBuilder

參數名

類型

預設值

說明

proxima.qc.builder.train_sample_count

uint32

0

指定訓練資料量,如果為0則使用全部資料

proxima.qc.builder.thread_count

uint32

0

構建時開啟線程數量,設定為0時為cpu核心數

proxima.qc.builder.centroid_count

string

可選

聚類中心點參數,支援層次聚類。層之間用“*”分隔。

一層聚類樣本:1000

兩層樣本:100*100

如果使用兩層中心點,一般第一次中心點數量比第二層多,效果更好。經驗值是第一層是第二層10倍。

未配置時,系統會自動推匯出合適的中心點個數,建議由系統自動推導。

proxima.qc.builder.cluster_class

string

OptKmeansCluster

指定聚類方法,更多參見聚類文檔

proxima.qc.builder.cluster_auto_tuning

bool

false

指定是否開啟中心點數目自適應

proxima.qc.builder.cluster_params_in_level_

IndexParams

-

指定聚類方法需要的參數,詳見聚類文檔

每層需要分別制定,從1開始。

比如第一層的key是proxima.qc.builder.cluster_params_in_level_1

proxima.qc.builder.optimizer_class

string

HcBuilder

針對中心點部分的最佳化器,用於提升分類時的精度,後續線上候選中心點部分的查詢均基於此方法進行,比如此處配置了HcBuilder,線上部分候選中心點查詢時會用HcSearcher來進行查詢,目前該參數可選擇HcBuilder、HnswBuilder、SsgBuilder和LinearBuilder等方法

proxima.qc.builder.optimizer_params

IndexParams

-

optimize方法對應的構建和檢索參數,比如optimizer配置了Hnswbuilder,那麼該處參數可配置為:

proxima.hnsw.builder.max_neighbor_count: 100 proxima.hnsw.searcher.max_scan_ratio: 0.1

proxima.qc.builder.converter_class

string

-

如果Measure是InnerProduct,會自動進行Mips轉換操作,使用L2檢索

proxima.qc.builder.converter_params

IndexParams

-

proxima.qc.builder.converter_class 初始化參數

proxima.qc.builder.quantizer_class

string

-

配置量化器,預設不使用量化器。可選有 Int8QuantizerConverter, HalfFloatConverter, DoubleBitConverter。一般配置量化器可提升效能,減少索引大小,召回視情況有所損失

proxima.qc.builder.quantizer_params

IndexParams

-

配置上面量化器相關參數

proxima.qc.builder.optimizer_quantizer_class

string

-

配置對中心點進行量化的 converter 名稱

proxima.qc.builder.optimizer_quantizer_params

IndexParams

-

對中心點進行量化的 converter 參數

proxima.qc.builder.quantize_by_centroid

bool

False

使用proxima.qc.builder.quantizer_class時,是否按中心點進行量化。目前僅支援 proxima.qc.builder.quantizer_class 為 Int8QuantizerConverter 的情況

proxima.qc.builder.store_original_features

bool

False

是否保留原始特徵。使用proxima.qc.builder.quantizer_class 時,IndexProvider 擷取的特徵是量化後的,需要開始此選項,才能擷取原始特徵

HnswSearcher

參數名

類型

預設值

說明

proxima.hnsw.builder.max_neighbor_count

uint32

100

指定圖中節點最大鄰居數。該值越大,代表圖的連通性越好,相應的構圖成本和索引size也會增加。

proxima.hnsw.builder.efconstruction

uint32

500

指控製圖構建過程中近鄰掃描地區大小,該值越大,離線構圖品質越好,索引構建越慢。建議初始從400配置

proxima.hnsw.builder.thread_count

uint32

0

構建時開啟線程數量,設定為0時為cpu核心數