1. 聚類
1.1 KmeansCluster / BatchKmeansCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.kmeans.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.kmeans.cluster.shard_factor | FLOAT | 16.0f | 多線程並發度調優因子 |
proxima.kmeans.cluster.epsilon | DOUBLE | FL_EPSILON | 聚類收斂精度 |
proxima.kmeans.cluster.max_iterations | UINT32 | 20 | 最大迭代次數 |
proxima.kmeans.cluster.purge_empty | BOOL | false | 是否刪除空中心點 |
proxima.kmeans.cluster.seeker_class | STRING | LinearSeeker | 尋找中心點演算法類 |
proxima.kmeans.cluster.seeker_params | IndexParams | 尋找中心點演算法類參數 IndexParams 對象 |
1.2 GpuKmeansCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.kmeans.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.kmeans.cluster.epsilon | DOUBLE | FL_EPSILON | 聚類收斂精度 |
proxima.kmeans.cluster.max_iterations | UINT32 | 100 | 最大迭代次數 |
proxima.kmeans.cluster.purge_empty | BOOL | false | 是否刪除空中心點 |
1.3 MiniBatchKmeansCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.minibatchkmeans.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.minibatchkmeans.cluster.shard_factor | FLOAT | 16.0f | 多線程並發度調優因子 |
proxima.minibatchkmeans.cluster.epsilon | DOUBLE | FL_EPSILON | 聚類收斂精度 |
proxima.minibatchkmeans.cluster.max_iterations | UINT32 | 20 | 最大迭代次數 |
proxima.minibatchkmeans.cluster.purge_empty | BOOL | false | 是否刪除空中心點 |
proxima.minibatchkmeans.cluster.try_count | UINT32 | 20 | 嘗試次數,最小值為 1 |
proxima.minibatchkmeans.cluster.batch_count | UINT32 | 0(自動計算) | 批量訓練的採樣的特徵數量,如果為 0,則值為特徵總數除以嘗試次數。 |
proxima.minibatchkmeans.cluster.seeker_class | STRING | LinearSeeker | 尋找中心點演算法類 |
proxima.minibatchkmeans.cluster.seeker_params | IndexParams | 尋找中心點演算法類參數 |
1.4 BikmeansCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.bikmeans.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.bikmeans.cluster.init_count | UINT32 | 0(自動計算) | 第一階段聚類初始化的中心點數,如果為 0,則值為特徵總數除以四。 |
proxima.bikmeans.cluster.purge_empty | BOOL | false | 是否刪除空中心點 |
proxima.bikmeans.cluster.first_class | STRING | KmeansCluster | 第一階段聚類方法 |
proxima.bikmeans.cluster.second_params | IndexParams | 第一階段聚類方法參數 | |
proxima.bikmeans.cluster.second_class | STRING | KmeansCluster | 第二階段聚類方法 |
proxima.bikmeans.cluster.second_params | IndexParams | 第二階段聚類方法參數 |
1.5 KmeansppCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.kmeanspp.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.kmeanspp.cluster.shard_factor | UINT32 | 16.0f | 多線程並發度調優因子 |
proxima.kmeanspp.cluster.class | STRING | KmeansCluster | 初始化完中心點後,調用的聚類方法 |
proxima.kmeanspp.cluster.params | IndexParams | 聚類方法參數 |
1.6 Kmc2Cluster / AFKmc2Cluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.kmc2.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.kmc2.cluster.shard_factor | UINT32 | 2.5f | 多線程並發度調優因子 |
proxima.kmc2.cluster.markov_chain_length | UINT32 | 0u | 馬爾科夫鏈長度,如果為 0,則值為線程數乘以並發因子 |
proxima.kmc2.cluster.class | STRING | KmeansCluster | 初始化完中心點後,調用的聚類方法 |
proxima.kmc2.cluster.params | IndexParams | 聚類方法參數 |
1.7 KmedoidsCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 中心點數量 |
proxima.kmedoids.cluster.count | UINT32 | 0 | 中心點數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.kmedoids.cluster.shard_factor | FLOAT | 16.0f | 多線程並發度調優因子 |
proxima.kmedoids.cluster.epsilon | DOUBLE | FL_EPSILON | 聚類收斂精度 |
proxima.kmedoids.cluster.max_iterations | UINT32 | 20 | 最大迭代次數 |
proxima.kmedoids.cluster.purge_empty | BOOL | false | 是否刪除空中心點 |
proxima.kmedoids.cluster.bench_ratio | FLOAT | 0.1f | 候選點比例 |
proxima.kmedoids.cluster.only_means | BOOL | false | 僅考慮均值作為候選點(演算法退化為 kmeans) |
proxima.kmedoids.cluster.without_means | BOOL | false | 不考慮均值作為候選點 |
proxima.kmedoids.cluster.seeker_class | STRING | LinearSeeker | 尋找中心點演算法類 |
proxima.kmedoids.cluster.seeker_params | IndexParams | 尋找中心點演算法類參數 IndexParams 對象 |
1.8 StratifiedCluster
參數名 | 類型 | 預設值 | 備忘 |
proxima.general.cluster.count | UINT32 | 0 | 第二層中心點總數量 |
proxima.stratified.cluster.count | UINT32 | 0 | 第二層中心點總數量,優先順序高於 general,低於 suggest 的 K 值 |
proxima.stratified.cluster.first_class | STARING | KmeansCluster | 第一層聚類方法 |
proxima.stratified.cluster.second_class | STARING | KmeansCluster | 第二層聚類方法 |
proxima.stratified.cluster.first_count | UINT32 | 0 | 第一層聚類中心點數量 |
proxima.stratified.cluster.second_count | UINT32 | 0 | 第二層聚類中心點數量 |
proxima.stratified.cluster.first_params | IndexParams | 第一層聚類方法參數 | |
proxima.stratified.cluster.second_params | IndexParams | 第二層聚類方法參數 | |
proxima.stratified.cluster.auto_tuning | BOOL | false |
2. 聚類預估
2.1 GapstatsClusterEstimater