このトピックでは、MADlibプラグインの使用方法について説明します。 MADlibは、AliPGデータベースで機械学習とグラフ計算モデルを実行するオープンソースライブラリです。 機械学習に関して、MADlibは数学演算のための関数とストアドプロシージャを提供します。 MADlibは、機械学習用の典型的な教師ありおよび教師なしアルゴリズムライブラリのセットも提供します。
前提条件
- ApsraDB RDS for PostgreSQLインスタンスは、次のいずれかのデータベースエンジンバージョンを実行します。
- RDSインスタンスのメジャーエンジンバージョンは、PostgreSQL 11またはPostgreSQL 12です。
RDSインスタンスは、20230830以降のマイナーエンジンバージョンを実行します。
重要拡張機能は、20230830より前のマイナーエンジンバージョンでサポートされています。 ApsaraDB RDS for PostgreSQLの拡張機能管理を標準化し、拡張機能のセキュリティを強化するために、ApsaraDB RDSはマイナーエンジンバージョンのイテレーションで脆弱な拡張機能を最適化する予定です。 その結果、以前のマイナーエンジンバージョンを実行するRDSインスタンスに対して、一部の拡張機能を作成できなくなりました。 詳細については、「 [製品の変更 /機能の変更] ApsaraDB RDS For PostgreSQLインスタンスの拡張機能作成の制限」をご参照ください。
20230830より前のマイナーエンジンバージョンを実行するRDSインスタンスの拡張機能を作成した場合、その拡張機能は影響を受けません。
RDSインスタンスの拡張機能を初めて作成する場合、または拡張機能を再作成する場合は、RDSインスタンスのマイナーエンジンバージョンを最新バージョンに更新する必要があります。 詳細については、「マイナーエンジンバージョンの更新」をご参照ください。
- RDSインスタンスへの接続には、特権アカウントが使用されます。 ApsaraDB RDSコンソールの [アカウント] ページで、使用するアカウントのタイプを確認できます。 アカウントが標準アカウントの場合、特権アカウントを作成し、その特権アカウントを使用してRDSインスタンスに接続する必要があります。 詳細については、「アカウントの作成」をご参照ください。
背景情報
- 分類と回帰の問題: MADlibは、K-Nearest Neighbor (KKN) 、多層パーセプトロンニューラルネットワーク、サポートベクターマシン (SVM) 、決定木などの一連のアルゴリズムを提供して、バイナリ分類と回帰の問題を解決します。 MADlibは、回帰の問題を解決するために、最小二乗回帰、一般化線形モデル (GLM) 、ロジスティック回帰、多項ロジスティック回帰などのモデルのセットも提供します。
- クラスタリングの問題: MADlibは、クラスタリング分析のためのK平均アルゴリズムを提供します。
- 相関分析: MADlibは、相関分析のためのAprioriアルゴリズムを提供する。 この機能は、おむつとビールの相関など、製品間の予期しない相関関係を見つけるのに役立ちます。
- 時系列データの分析: MADlibは、時系列データの将来の傾向を予測するための自己回帰統合移動平均 (ARIMA) モデルを提供します。
- その他: MADlibは、データ次元削減の主な要因を抽出するための主成分分析 (PCA) を提供します。 MADlibは、ドキュメント分類とトピックモデリングのための潜在的ディリクレ割り当て (LDA) モデルを提供します。
データ型 | モデルまたは特徴 | 説明 |
最短パス | すべての頂点間の最短パス | すべての頂点間の最短パスを計算し、結果を特定の結果テーブルに保存します。 このモデルは、結果テーブルに基づいて、開始頂点から終了頂点までの最短パスを照会します。 |
特定の頂点と他のすべての頂点間の最短パス | 特定の頂点と他のすべての頂点間の最短パスを計算し、結果を特定の結果テーブルに保存します。 このモデルは、結果テーブルに基づいて、特定の頂点から他の頂点への最短パスを照会します。 | |
Breadth-first search (BFS) | BFS | BFSメソッドを使用して、特定のソース頂点から到達可能な頂点を照会します。 |
ヒット | HITSスコア | 有向グラフのすべての頂点のHITSスコアを照会します。 HITSスコアは、ハブスコアおよび権限スコアを含む。 |
Webページランキング | PageRank | 有向グラフのすべての頂点のPageRank値を照会します。 |
弱い接続コンポーネント | 弱い接続コンポーネント | 有向グラフ内のすべての弱結合コンポーネントを照会します。 |
測定 | 平均パス長 | グラフの平均最短パス長を計算します。 |
近接性 | グラフ内のすべてのノードの近さの中心性を計算します。 | |
グラフ径 | グラフの直径を計算します。 | |
内程度または外程度 | すべての頂点のin-degreeとout-degreeを計算します。 |
MADlibプラグインの有効化または無効化
- 次のステートメントを実行して、MADlibプラグインを有効にします。説明 次のステートメントを実行する前に、
CREATE EXTENSION plpythonu;
ステートメントを実行して、plpythonuプラグインを作成する必要があります。拡張madlibを作成します。
- 次のステートメントを実行して、MADlibプラグインを無効にします。
DROP EXTENSION madlib;
参考資料
MADlibプラグインの詳細については、「MADlibドキュメント」をご参照ください。