交互最小二乗 (ALS) は、推奨システム、特にハイブリッド協調フィルタリングで頻繁に使用される行列因数分解アルゴリズムです。 それは、ユーザ − アイテム格付け行列を2つのより低いランクの行列の積に分解し、それによって次元削減を達成し、欠落した値を埋め、潜在的なユーザの好みおよびアイテム特性を明らかにします。
サポートされるコンピューティングリソース
MaxCompute
Flink
入出力
入力ポート
サポートされる上流コンポーネント:
出力ポート
ユーザーとアイテムの要素はAls Ratingに対応します。
コンポーネントの設定
パイプラインページにAls Matrix Factorizationコンポーネントを追加し、次のパラメーターを設定します。
カテゴリ
パラメーター
説明
フィールド設定
ユーザー列名
入力テーブルのユーザーID列の名前。 列のデータはBIGINT型でなければなりません。
アイテム列名
入力テーブルのitem列の名前。 列のデータはBIGINT型でなければなりません。
レーティング列名
入力テーブルのitemsに対してユーザーによって提供されたスコアを含む列の名前。 列のデータは数値型である必要があります。
パラメーター設定
num要因
要因の数。 有効値: (0,+ ∞) デフォルト値は 10 です。
反復回数
反復回数。 有効値: (0,+ ∞) デフォルト値は 10 です。
正則化係数
正則化係数。 有効値: (0,+ ∞) デフォルト値: 0.1
チェックボックス
暗黙のプリファレンスモデルを使用するかどうかを指定します。
alphaパラメータ
暗黙のプリファレンス係数。 有効値: (0,+ ∞) デフォルト値: 40。
出力テーブルのライフサイクル
出力モデルテーブルのライフサイクル。 単位:日
チューニング
数の労働者
ワーカーノードの数です。 有効な値: 1 ~ 9999
ノードメモリ、MB
各ワーカーノードのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。
例
Als Matrix Factorizationコンポーネントの入力として次のデータを使用すると、次のユーザーファクターとアイテムファクターを取得できます。
入力データ
ユーザー_id
iteme_id
評価
10944750
13451
0
10944751
13452
1
10944752
13453
2
10944753
13454
2
10944754
13455
4
... ...
... ...
... ...
出力ユーザー要因テーブル
ユーザー_id
要因
8528750
[0.026986524、0.03350178、0.03532385、0.019542359、0.020429865、0.02046867、0.022253247、0.027391396、0.018985065、0.04889483]
282500
[0.116156064、0.07193632、0.090851225、0.017075706、0.025412979、0.047022138、0.12534861、0.05869226、0.11170533、0.1640192]
4895250
[0.038429666、0.061858658、0.04236993、0.055866677、0.031814687、0.0417443、0.012085311、0.0379342、0.10767074、0.028392972]
... ...
... ...
出力アイテム要因テーブル
iteme_id
要因
24601
[0.0063337763、0.026349949、0.0064828005、0.01734504、0.022049638、0.0059205987、0.008568814、0.0015981696、0.0、0.013601779]
26699
[0.0027524426、0.0043066847、0.0031336215、0.00269448、0.0022347474、0.0020477585、0.0027995422、0.0025390312、0.0033011117、0.003957773]
20751
[0.03902271、0.050952066、0.032981463、0.03862796、0.048720762、0.027976315、0.02721664、0.018149626、0.0149896275、0.026251089]
... ...
... ...