全部產品
Search
文件中心

:Proxima Cluster參數

更新時間:Jul 13, 2024

1. 聚類

1.1 KmeansCluster / BatchKmeansCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.kmeans.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.kmeans.cluster.shard_factor

FLOAT

16.0f

多線程並發度調優因子

proxima.kmeans.cluster.epsilon

DOUBLE

FL_EPSILON

聚類收斂精度

proxima.kmeans.cluster.max_iterations

UINT32

20

最大迭代次數

proxima.kmeans.cluster.purge_empty

BOOL

false

是否刪除空中心點

proxima.kmeans.cluster.seeker_class

STRING

LinearSeeker

尋找中心點演算法類

proxima.kmeans.cluster.seeker_params

IndexParams

尋找中心點演算法類參數

IndexParams 對象

1.2 GpuKmeansCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.kmeans.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.kmeans.cluster.epsilon

DOUBLE

FL_EPSILON

聚類收斂精度

proxima.kmeans.cluster.max_iterations

UINT32

100

最大迭代次數

proxima.kmeans.cluster.purge_empty

BOOL

false

是否刪除空中心點

1.3 MiniBatchKmeansCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.minibatchkmeans.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.minibatchkmeans.cluster.shard_factor

FLOAT

16.0f

多線程並發度調優因子

proxima.minibatchkmeans.cluster.epsilon

DOUBLE

FL_EPSILON

聚類收斂精度

proxima.minibatchkmeans.cluster.max_iterations

UINT32

20

最大迭代次數

proxima.minibatchkmeans.cluster.purge_empty

BOOL

false

是否刪除空中心點

proxima.minibatchkmeans.cluster.try_count

UINT32

20

嘗試次數,最小值為 1

proxima.minibatchkmeans.cluster.batch_count

UINT32

0(自動計算)

批量訓練的採樣的特徵數量,如果為 0,則值為特徵總數除以嘗試次數

proxima.minibatchkmeans.cluster.seeker_class

STRING

LinearSeeker

尋找中心點演算法類

proxima.minibatchkmeans.cluster.seeker_params

IndexParams

尋找中心點演算法類參數

1.4 BikmeansCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.bikmeans.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.bikmeans.cluster.init_count

UINT32

0(自動計算)

第一階段聚類初始化的中心點數,如果為 0,則值為特徵總數除以四。

proxima.bikmeans.cluster.purge_empty

BOOL

false

是否刪除空中心點

proxima.bikmeans.cluster.first_class

STRING

KmeansCluster

第一階段聚類方法

proxima.bikmeans.cluster.second_params

IndexParams

第一階段聚類方法參數

proxima.bikmeans.cluster.second_class

STRING

KmeansCluster

第二階段聚類方法

proxima.bikmeans.cluster.second_params

IndexParams

第二階段聚類方法參數

1.5 KmeansppCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.kmeanspp.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.kmeanspp.cluster.shard_factor

UINT32

16.0f

多線程並發度調優因子

proxima.kmeanspp.cluster.class

STRING

KmeansCluster

初始化完中心點後,調用的聚類方法

proxima.kmeanspp.cluster.params

IndexParams

聚類方法參數

1.6 Kmc2Cluster / AFKmc2Cluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.kmc2.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.kmc2.cluster.shard_factor

UINT32

2.5f

多線程並發度調優因子

proxima.kmc2.cluster.markov_chain_length

UINT32

0u

馬爾科夫鏈長度,如果為 0,則值為線程數乘以並發因子

proxima.kmc2.cluster.class

STRING

KmeansCluster

初始化完中心點後,調用的聚類方法

proxima.kmc2.cluster.params

IndexParams

聚類方法參數

1.7 KmedoidsCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

中心點數量

proxima.kmedoids.cluster.count

UINT32

0

中心點數量,優先順序高於 general,低於 suggest 的 K 值

proxima.kmedoids.cluster.shard_factor

FLOAT

16.0f

多線程並發度調優因子

proxima.kmedoids.cluster.epsilon

DOUBLE

FL_EPSILON

聚類收斂精度

proxima.kmedoids.cluster.max_iterations

UINT32

20

最大迭代次數

proxima.kmedoids.cluster.purge_empty

BOOL

false

是否刪除空中心點

proxima.kmedoids.cluster.bench_ratio

FLOAT

0.1f

候選點比例

proxima.kmedoids.cluster.only_means

BOOL

false

僅考慮均值作為候選點(演算法退化為 kmeans)

proxima.kmedoids.cluster.without_means

BOOL

false

不考慮均值作為候選點

proxima.kmedoids.cluster.seeker_class

STRING

LinearSeeker

尋找中心點演算法類

proxima.kmedoids.cluster.seeker_params

IndexParams

尋找中心點演算法類參數

IndexParams 對象

1.8 StratifiedCluster

參數名

類型

預設值

備忘

proxima.general.cluster.count

UINT32

0

第二層中心點總數量

proxima.stratified.cluster.count

UINT32

0

第二層中心點總數量,優先順序高於 general,低於 suggest 的 K 值

proxima.stratified.cluster.first_class

STARING

KmeansCluster

第一層聚類方法

proxima.stratified.cluster.second_class

STARING

KmeansCluster

第二層聚類方法

proxima.stratified.cluster.first_count

UINT32

0

第一層聚類中心點數量

proxima.stratified.cluster.second_count

UINT32

0

第二層聚類中心點數量

proxima.stratified.cluster.first_params

IndexParams

第一層聚類方法參數

proxima.stratified.cluster.second_params

IndexParams

第二層聚類方法參數

proxima.stratified.cluster.auto_tuning

BOOL

false

2. 聚類預估

2.1 GapstatsClusterEstimater