本文为您介绍Designer提供的协方差。
在概率论和统计学中,协方差用于衡量两个变量的总体误差。方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E(X) =μ与E(Y)=ν的两个实数,其随机变量X与Y之间的协方差定义为:cov(X, Y)=E((X - μ) (Y - ν))。
组件配置
您可以使用以下任意一种方式,配置协方差组件参数。
方式一:可视化方式
在Designer工作流页面配置组件参数。
页签 | 参数 | 描述 |
字段设置 | 输入列 | 选择输入列,只支持bigint与double类型。 |
进行调优 | 核心数 | 计算的核心数,如果未配置,则系统自动分配。 |
内存数 | 每个核心的内存,如果未配置,则系统自动分配。单位为MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置该组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
PAI -name cov
-project algo_public
-DinputTableName=maple_test_cov_basic12x10_input
-DoutputTableName=maple_test_cov_basic12x10_output
-DcoreNum=6
-DmemSizePerCore=110;
参数名称 | 是否必须 | 描述 | 默认值 |
inputTableName | 是 | 输入表的名称。 | 无 |
inputTablePartitions | 否 | 输入表中,参与训练的分区。系统支持以下格式:
说明 指定多个分区时,分区之间使用英文逗号(,)分隔。 | 输入表的所有分区 |
outputTableName | 是 | 输出表名称。 | 无 |
selectedColNames | 否 | 输入表选择列名类型。 | 选择全部列 |
lifecycle | 否 | 指定输出表的生命周期。 | 无 |
coreNum | 否 | 计算的核心数,取值范围为正整数。取值范围[1, 9999]。 | 默认自动计算 |
memSizePerCore | 否 | 每个核心的内存,取值范围为1 MB~65536 MB。 | 默认自动计算 |