LinearBuilder
參數名 | 類型 | 預設值 | 說明 |
proxima.linear.builder.column_major_order | string | false | 構建的時候特徵用行排(false)/列排(true) |
QcBuilder
參數名 | 類型 | 預設值 | 說明 |
proxima.qc.builder.train_sample_count | uint32 | 0 | 指定訓練資料量,如果為0則使用全部資料 |
proxima.qc.builder.thread_count | uint32 | 0 | 構建時開啟線程數量,設定為0時為cpu核心數 |
proxima.qc.builder.centroid_count | string | 可選 | 聚類中心點參數,支援層次聚類。層之間用“*”分隔。 一層聚類樣本:1000 兩層樣本:100*100 如果使用兩層中心點,一般第一次中心點數量比第二層多,效果更好。經驗值是第一層是第二層10倍。 未配置時,系統會自動推匯出合適的中心點個數,建議由系統自動推導。 |
proxima.qc.builder.cluster_class | string | OptKmeansCluster | 指定聚類方法,更多參見聚類文檔。 |
proxima.qc.builder.cluster_auto_tuning | bool | false | 指定是否開啟中心點數目自適應 |
proxima.qc.builder.cluster_params_in_level_ | IndexParams | - | 指定聚類方法需要的參數,詳見聚類文檔。 每層需要分別制定,從1開始。 比如第一層的key是proxima.qc.builder.cluster_params_in_level_1 |
proxima.qc.builder.optimizer_class | string | HcBuilder | 針對中心點部分的最佳化器,用於提升分類時的精度,後續線上候選中心點部分的查詢均基於此方法進行,比如此處配置了HcBuilder,線上部分候選中心點查詢時會用HcSearcher來進行查詢,目前該參數可選擇HcBuilder、HnswBuilder、SsgBuilder和LinearBuilder等方法 |
proxima.qc.builder.optimizer_params | IndexParams | - | optimize方法對應的構建和檢索參數,比如optimizer配置了Hnswbuilder,那麼該處參數可配置為: proxima.hnsw.builder.max_neighbor_count: 100 proxima.hnsw.searcher.max_scan_ratio: 0.1 |
proxima.qc.builder.converter_class | string | - | 如果Measure是InnerProduct,會自動進行Mips轉換操作,使用L2檢索 |
proxima.qc.builder.converter_params | IndexParams | - | proxima.qc.builder.converter_class 初始化參數 |
proxima.qc.builder.quantizer_class | string | - | 配置量化器,預設不使用量化器。可選有 Int8QuantizerConverter, HalfFloatConverter, DoubleBitConverter。一般配置量化器可提升效能,減少索引大小,召回視情況有所損失 |
proxima.qc.builder.quantizer_params | IndexParams | - | 配置上面量化器相關參數 |
proxima.qc.builder.optimizer_quantizer_class | string | - | 配置對中心點進行量化的 converter 名稱 |
proxima.qc.builder.optimizer_quantizer_params | IndexParams | - | 對中心點進行量化的 converter 參數 |
proxima.qc.builder.quantize_by_centroid | bool | False | 使用proxima.qc.builder.quantizer_class時,是否按中心點進行量化。目前僅支援 proxima.qc.builder.quantizer_class 為 Int8QuantizerConverter 的情況 |
proxima.qc.builder.store_original_features | bool | False | 是否保留原始特徵。使用proxima.qc.builder.quantizer_class 時,IndexProvider 擷取的特徵是量化後的,需要開始此選項,才能擷取原始特徵 |
HnswSearcher
參數名 | 類型 | 預設值 | 說明 |
proxima.hnsw.builder.max_neighbor_count | uint32 | 100 | 指定圖中節點最大鄰居數。該值越大,代表圖的連通性越好,相應的構圖成本和索引size也會增加。 |
proxima.hnsw.builder.efconstruction | uint32 | 500 | 指控製圖構建過程中近鄰掃描地區大小,該值越大,離線構圖品質越好,索引構建越慢。建議初始從400配置 |
proxima.hnsw.builder.thread_count | uint32 | 0 | 構建時開啟線程數量,設定為0時為cpu核心數 |