このトピックでは、Machine Learning Designerが提供する1つのサンプルTテストコンポーネントについて説明します。 One Sample T Testコンポーネントを使用して、変数の全体平均と特定の値との間に有意差が存在するかどうかを判定する。 Tテストを実行するサンプルは、正規分布に従う必要があります。
コンポーネントの設定
次のいずれかの方法を使用して、one Sample T Testコンポーネントを設定できます。
方法1: Machine Learning Designerでコンポーネントを構成する
Machine Learning Platform for AIコンソールのMachine Learning Designerの [パイプライン設定] タブでコンポーネントを設定します。 次の表に、コンポーネントの設定に使用されるパラメーターを示します。
タブ | パラメーター | 説明 |
フィールド設定 | サンプル1列 | サンプル1を含むカラム。 |
パラメーター設定 | 代替仮説タイプ | 対立仮説タイプ。 |
信頼レベル | テスト結果の信頼レベル。 | |
仮定された平均 | 仮定された平均。 | |
2つの人口の分散は等しい | 2つの母集団の分散が等しいかどうかを指定します。 設定可能な値は、Yes または No です。 | |
コア番号 | コアの数。 値は正の整数でなければなりません。 | |
コアあたりのメモリサイズ | 各コアのメモリサイズ。 有効な値: 1 ~ 65536 単位:MB。 |
方法2: AIコマンド用の機械学習プラットフォームの実行
Machine Learning Platform for AIコマンドを実行して、コンポーネントパラメーターを設定します。 SQLスクリプトコンポーネントを使用して、Machine Learning Platform for AIコマンドを実行できます。 詳細については、「SQLスクリプト」をご参照ください。 コマンドのパラメーターを次の表に示します。
pai -name t_test -project algo_public
-DxTableName=pai_t_test_all_type
-DxColName=col1_double
-DoutputTableName=pai_t_test_out
-DxTablePartitions=ds=2010/dt=1
-Dalternative=less
-Dmu=47
-DconfidenceLevel=0.95
パラメーター | 必須 | 説明 | デフォルト値 |
xTableName | 可 | 入力テーブルの名前。 | None |
xColName | 可 | テスト用に入力テーブルから選択する列。 | None |
outputTableName | 可 | 出力テーブルの名前。 | None |
xTablePartitions | 不可 | 入力テーブルから選択するパーティション。 | Null |
代替 | 不可 | 対立仮説タイプ。 有効な値: two.sided、less、greater。 | two.sided |
ミュー | 不可 | 仮定された平均。 | 0 |
confidenceLevel | 不可 | 信頼レベル。 有効な値: 0.8、0.9、0.95、0.99、0.995、0.999。 | 0.95 |
アウトプットの説明
出力テーブルはJSON形式で、1つの行と1つの列のみが含まれます。
{
"AlternativeHypthesis": "mean not equals to 0",
"ConfidenceInterval": "(44.72234194006504, 46.27765805993496)",
"ConfidenceLevel": 0.95,
"alpha": 0.05,
"df": 99,
"mean": 45.5,
"p": 0,
"stdDeviation": 3.919647479510927,
"t": 116.081867662439
}