交互最小二乗 (ALS) は、疎行列を因数分解し、欠けているエントリの値を予測して基本的なトレーニングモデルを取得する行列因数分解アルゴリズムです。 ハイブリッド協調フィルタリングアルゴリズムとも呼ばれるALSは、ユーザーとアイテムを組み合わせます。
制限事項
Swing Trainコンポーネントは、MaxComputeおよびRealtime Compute for Apache Flinkのコンピューティングリソースに基づいて使用できます。
PAIコンソールでコンポーネントを設定する
入力ポート
入力ポート (左から右へ)
データ型
推奨上流コンポーネント
必須
入力テーブル
N/A
データ前処理
可
コンポーネントパラメータ
タブ
パラメーター
説明
フィールド設定
ユーザー列名
入力テーブルのユーザーID列の名前。 列のデータはBIGINT型でなければなりません。
アイテム列名
入力テーブルのitem列の名前。 列のデータはBIGINT型でなければなりません。
レーティング列名
入力テーブルのitemsに対してユーザーによって提供されたスコアを含む列の名前。 列のデータは数値型である必要があります。
パラメーター設定
num要因
要因の数。 有効値: (0,+ ∞) デフォルト値は 10 です。
反復回数
反復回数。 有効値: (0,+ ∞) デフォルト値は 10 です。
正則化係数
正則化係数。 有効値: (0,+ ∞) デフォルト値: 0.1
チェックボックス
暗黙のプリファレンスモデルを使用するかどうかを指定します。
alphaパラメータ
暗黙のプリファレンス係数。 有効値: (0,+ ∞) デフォルト値: 40。
出力テーブルのライフサイクル
出力モデルテーブルのライフサイクル。 単位:日
チューニング
数の労働者
ワーカーノードの数。 有効な値: 1 ~ 9999
ノードメモリ、MB
各ワーカーノードのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。
例
Als Matrix Factorizationコンポーネントの入力として次のデータを使用すると、次のユーザーファクターとアイテムファクターを取得できます。
入力データ
ユーザー_id
iteme_id
評価
10944750
13451
0
10944751
13452
1
10944752
13453
2
10944753
13454
2
10944754
13455
4
... ...
... ...
... ...
出力ユーザー要因テーブル
ユーザー_id
要因
8528750
[0.026986524、0.03350178、0.03532385、0.019542359、0.020429865、0.02046867、0.022253247、0.027391396、0.018985065、0.04889483]
282500
[0.116156064、0.07193632、0.090851225、0.017075706、0.025412979、0.047022138、0.12534861、0.05869226、0.11170533、0.1640192]
4895250
[0.038429666、0.061858658、0.04236993、0.055866677、0.031814687、0.0417443、0.012085311、0.0379342、0.10767074、0.028392972]
... ...
... ...
出力アイテム要因テーブル
iteme_id
要因
24601
[0.0063337763、0.026349949、0.0064828005、0.01734504、0.022049638、0.0059205987、0.008568814、0.0015981696、0.0、0.013601779]
26699
[0.0027524426、0.0043066847、0.0031336215、0.00269448、0.0022347474、0.0020477585、0.0027995422、0.0025390312、0.0033011117、0.003957773]
20751
[0.03902271、0.050952066、0.032981463、0.03862796、0.048720762、0.027976315、0.02721664、0.018149626、0.0149896275、0.026251089]
... ...
... ...