すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:相関係数行列

最終更新日:Jul 22, 2024

このトピックでは、Machine Learning Designer (旧称Machine Learning Studio) が提供する相関係数行列コンポーネントについて説明します。

相関係数は、行列内の列間の相関を示す。 係数は [-1,1] の範囲です。 countパラメーターは、値が2つの連続する列の非ゼロ要素の数である場合に測定されます。

コンポーネントの設定

次のいずれかの方法を使用して、相関係数行列コンポーネントを設定できます。

Machine Learning Platform for AI (PAI) のMachine Learning Designerのパイプラインページで、相関係数行列コンポーネントのパラメーターを設定できます。 Machine Learning Designerは、以前はMachine Learning Studioとして知られていました。 下表に、各パラメーターを説明します。
タブパラメーター説明
フィールド設定すべてデフォルトで選択N/A
チューニングコアこのパラメーターは、[メモリサイズ] パラメーターと共に使用する必要があります。
メモリサイズこのパラメーターは、Coresパラメーターと共に使用する必要があります。

方法2: PAIコマンドを使用する

PAIコマンドを使用してコンポーネントパラメータを設定します。 SQLスクリプトコンポーネントを使用してPAIコマンドを呼び出すことができます。 詳細については、「SQLスクリプト」をご参照ください。
PAI -name corrcoef
    -プロジェクトalgo_public
    -DinputTableName=maple_test_corrcoef_basic12x10_input
    -DoutputTableName=maple_test_corrcoef_basic12x10_output
    -DcoreNum=1
    -DmemSizePerCore=110; 
パラメーター必須説明デフォルト値
inputTableName入力テーブルの名前。 デフォルト値なし
inputTablePartitions不可トレーニング用に入力テーブルから選択されたパーティション。 次の形式がサポートされています。
  • Partition_name=value
  • name1=value1/name2=value2: マルチレベルパーティション
説明 複数のパーティションを指定する場合は、コンマ (,) で区切ります。
デフォルト値なし
outputTableName出力テーブルの名前。 デフォルト値なし
selectedColNames不可入力テーブルから選択された列。 すべての列
ライフサイクル不可出力テーブルのライフサイクル。 デフォルト値なし
coreNum不可このパラメーターは、memSizePerCoreパラメーターと共に使用する必要があります。 値は正の整数でなければなりません。 有効な値: 1 ~ 9999 システムによって決定される
memSizePerCore不可各コアのメモリサイズ。 単位:MB。 値は [1024, 64 × 1024] の範囲の正の整数でなければなりません。 システムによって決定される

例:

  • 入力データ
    col0: ダブルcol1:bigintcol2: ダブルcol3:bigintcol4: ダブルcol5:bigintcol6: ダブルcol7:bigintcol8: ダブルcol9: ダブル
    199533521154332987640
    1142610169565911623109105
    10389796511873505581
    7920637152477312175
    871666472514429910857
    111043837106513918097
    84有効期限の 30 70468694224548
    3517107641011253349096
    13613912911711228228
    624102881003667541285
    492744936811060728658
    92119011341有効期限の 15 748318111
  • PAIコマンド
    PAI -name corrcoef
        -プロジェクトalgo_public
        -DinputTableName=maple_test_corrcoef_basic12x10_input
        -DoutputTableName=maple_test_corrcoef_basic12x10_output
        -DcoreNum=1
        -DmemSizePerCore=110; 
  • Output
    columnsnamescol0col1col2col3col4col5col6col7col8col9
    col01-0.21156572518207240.05983062597065610.2599903570684693-0.3483249188225586-0.287162543968099260.47880162127435116-0.13646519484213326-0.195001587646800920.3897390240949085
    col1-0.21156572518207241-0.8444477377898585-0.175076362215945330.409433841505713770.09135976026101403-0.30185063746265740.40733726912808044-0.118277391245900710.12433851389455183
    col20.0598306259706561-0.844447737789858510.18518346647293102-0.20934839228057014-0.18964175123896590.1799377498863213-0.38588856764699480.202545692037738920.13476160753756655
    col30.2599903570684693-0.175076362215945330.1851834664729310210.03988018649854009-0.43737887418329147-0.0538182964252671840.2900856441586986-0.36075479100756880.4912019074930449
    col4-0.34832491882255860.40943384150571377-0.209348392280570140.0398801864985400910.1465605209246875-0.50160303643479550.54960243257111170.0137432561153941220.07497231559184887
    col5-0.287162543968099260.09135976026101403-0.1896417512389659-0.437378874183291470.146560520924687510.16729809310873522-0.298906558287969640.3618518101014617-0.1713960957286885
    col60.47880162127435116-0.30185063746265740.1799377498863213-0.053818296425267184-0.50160303643479550.167298093108735221-0.8165019880156462-0.11173420918721436-0.10363860378347944
    col7-0.136465194842133260.40733726912808044-0.38588856764699480.29008564415869860.5496024325711117-0.29890655828796964-0.816501988015646210.074359074715444690.11711976051999162
    col8-0.19500158764680092-0.118277391245900710.20254569203773892-0.36075479100756880.0137432561153941220.3618518101014617-0.111734209187214360.074359074715444691-0.18463012549540175
    col90.38973902409490850.124338513894551830.134761607537566550.49120190749304490.07497231559184887-0.1713960957286885-0.103638603783479440.11711976051999162-0.184630125495401751