データ開発は、データの生成、収集、保存、分析、計算、抽出、提示、および共有を行うプロセスです。

データ開発プロセス
前の図に示すように、破線で囲まれた DataWorks の手順を実行することができます。

データ開発プロセスには下記のステップが含まれます。

  1. データの生成:各ビジネスシステムは、毎日大量の構造化データを生成し、MySQL、Oracle、RDS データベースなどの独自のデータベースに保存します。
  2. データの収集および保存:ビジネスシステムから MaxCompute にデータを同期し、MaxCompute の強力なデータストレージおよび処理機能を使用してデータを分析することができます。

    DataWorks のデータ統合サービスは、さまざまな接続をサポートしています。 事前に設定された定期的なパターン基づいて、ビジネスシステムから MaxCompute へのデータの同期が可能になります。

  3. データの分析と計算:データを同期すると、MaxCompute でデータを処理するための ODPS SQL と ODPS MR ノードおよびデータ分析用の他のノードを作成し、データの価値の分析およびマイニングを行うことができます。
  4. データの抽出:データ処理と分析の結果をビジネスシステムにエクスポートして、さらに処理を行うことができます。
  5. データの提示と共有:データの抽出後、ビッグデータの処理と分析の結果を、レポートや地理情報システム (GIS) など複数の方法で提示できます。 結果を他のユーザーと共有することもできます。