全部產品
Search
文件中心

Platform For AI:共變數

更新時間:Jul 13, 2024

本文為您介紹Designer提供的共變數。

在機率論和統計學中,共變數用于衡量兩個變數的總體誤差。方差是共變數的一種特殊情況,即當兩個變數是相同的情況。期望值分別為E(X) =μ與E(Y)=ν的兩個實數,其隨機變數X與Y之間的共變數定義為:cov(X, Y)=E((X - μ) (Y - ν))。

組件配置

您可以使用以下任意一種方式,配置共變數組件參數。

方式一:可視化方式

Designer工作流程頁面配置組件參數。

頁簽

參數

描述

欄位設定

輸入列

選擇輸入列,只支援bigint與double類型。

進行調優

核心數

計算的核心數,如果未配置,則系統自動分配。

記憶體數

每個核心的記憶體,如果未配置,則系統自動分配。單位為MB。

方式二:PAI命令方式

使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼

PAI -name cov
    -project algo_public
    -DinputTableName=maple_test_cov_basic12x10_input
    -DoutputTableName=maple_test_cov_basic12x10_output
    -DcoreNum=6
    -DmemSizePerCore=110;

參數名稱

是否必須

描述

預設值

inputTableName

輸入表的名稱。

inputTablePartitions

輸入表中,參與訓練的分區。系統支援以下格式:

  • Partition_name=value

  • name1=value1/name2=value2:多級分區

說明

指定多個分區時,分區之間使用英文逗號(,)分隔。

輸入表的所有分區

outputTableName

輸出表名稱。

selectedColNames

輸入表選擇列名類型。

選擇全部列

lifecycle

指定輸出表的生命週期。

coreNum

計算的核心數,取值範圍為正整數。取值範圍[1, 9999]。

預設自動計算

memSizePerCore

每個核心的記憶體,取值範圍為1 MB~65536 MB。

預設自動計算