本文為您介紹Designer提供的單樣本T檢驗。單樣本T檢驗旨在檢驗某個變數的總體均值與某個指定值之間是否存在顯著差異,其檢驗的樣本必須總體服從常態分佈。
組件配置
您可以使用以下任意一種方式,配置單樣本T檢驗組件參數。
方式一:可視化方式
在Designer工作流程頁面配置組件參數。
頁簽 | 參數 | 描述 |
欄位設定 | 樣本1所在列 | 進行訓練的樣本1所在列。 |
參數設定 | 對立假設類型 | 對立假設的類型。 |
信賴度 | 檢測結果的信賴度。 | |
假設均值大小 | 假設均值的大小。 | |
兩總體方差是否相等 | 兩個總體值的方差是否相等。可選true或者false。 | |
節點個數 | 節點個數,正整數格式。 | |
單個節點記憶體大小 | 每個節點的記憶體大小。取值範圍1 MB~65536 MB。 |
方式二:PAI命令方式
使用PAI命令方式,配置該組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼。
pai -name t_test -project algo_public
-DxTableName=pai_t_test_all_type
-DxColName=col1_double
-DoutputTableName=pai_t_test_out
-DxTablePartitions=ds=2010/dt=1
-Dalternative=less
-Dmu=47
-DconfidenceLevel=0.95
參數 | 是否必須 | 描述 | 預設值 |
xTableName | 是 | 表名稱 | 無 |
xColName | 是 | 需要進行T檢驗的列 | 無 |
outputTableName | 是 | 輸出表名稱 | 無 |
xTablePartitions | 否 | 表的分區列表 | 空 |
alternative | 否 | 對立假設。取值包括:two.sided、less、greater。 | two.sided |
mu | 否 | 假設的均值 | 0 |
confidenceLevel | 否 | 信賴度。取值包括:0.8、0.9、0.95、0.99、0.995、0.999。 | 0.95 |
輸出說明
輸出一個一行一列的JSON格式表。
{
"AlternativeHypthesis": "mean not equals to 0",
"ConfidenceInterval": "(44.72234194006504, 46.27765805993496)",
"ConfidenceLevel": 0.95,
"alpha": 0.05,
"df": 99,
"mean": 45.5,
"p": 0,
"stdDeviation": 3.919647479510927,
"t": 116.081867662439
}