DataWorks のワークスペースは、MaxCompute のプロジェクトに類似しています。 このトピックでは、DataWorks コンソールでワークスペースを作成する方法を説明します。

始める前に

Alibaba Cloud アカウントを取得します。 詳細については、「Alibaba Cloud アカウントの準備」をご参照ください。 このトピックで説明するように、ワークスペースを作成するには Alibaba Cloud アカウントを取得する必要があります。
Resource Access Management (RAM) ユーザーとしてワークスペースを作成する手順は、このトピックで説明した手順と同じです。

手順

  1. Alibaba Cloud アカウントを使用して [DataWorks コンソール] にログインします。
  2. [概観]ページの右側の[ショートカット]セクションにある[ワークスペースの作成]をクリックします。

    左側のナビゲーションウインドウの[ワークスペース]をクリックし、表示されたページの[ワークスペースの作成]をクリックすることもできます。

  3. 表示された[ワークスペースの作成]ダイアログボックスの[基本情報]ステップにパラメータを設定し、[次に]をクリックします。
    セクション パラメーター 説明
    基本情報 ワークスペース名 ワークスペースの名前を設定します。 名前の長さは 2 文字から 128 文字で、先頭は英字とする必要があります。 英字、アンダースコア(_)、および数字が使用できます。
    表示名 サービスの表示名を設定します。 名前の長さは、最大 27 文字です。 先頭は英字とする必要があり、英字、アンダースコア (_)、および数字が使用できます。
    モード ワークスペースのモードを設定します。 モードは DataWorks の新機能です。基本モードと標準モードがあります。 基本モードと標準モードの違いについては、「簡易モードと標準モード」をご参照ください 。
    • 基本モード:基本ワークスペースは、1つのMaxComputeプロジェクトのみに関連付けられます。 基本ワークスペースでは、開発環境と本番環境が分離されません。 基本ワークスペースでは、単純なデータ開発のみ可能です。データ開発プロセスおよびテーブル権限の厳密な管理はできません。
    • 標準モード:標準ワークスペースは、2 つの別々の MaxCompute プロジェクトに関連付けられます。 プロジェクトの 1 つは開発環境として機能し、もう 1 つは本番環境として機能します。 標準ワークスペースでは、標準的な方法でのコード開発が保証され、テーブルの権限を厳密に管理できます。 標準ワークスペースでは、データのセキュリティ確保のため、本番環境でのテーブル操作が制限されます。
    説明 ワークスペースの説明を記述します。
    詳細設定 SELECT クエリ結果のダウンロード ワークスペースのメンバーによる、DataStudio の SELECT 文で返されたクエリ結果のダウンロード可否を設定します。 このオプションを無効に設定すすると、ワークスペースのメンバーはクエリ結果をダウンロードできません。
  4. [エンジンとサービスの選択]ステップで、必要な計算エンジンとサービスを選択し、[次へ]をクリックします。
    DataWorks は、商用サービスとして利用可能になりました。 リージョンで DataWorks を有効化していない場合は、有効化してからワークスペースを作成してください。
    セクション サービスまたはエンジン 説明
    DataWorks のサービス
    このセクションのチェックボックスは、デフォルトで選択された状態です。
    Data Integration 安定性が高く、効率的でスケーラブルなサービスを提供するデータ同期プラットフォームです。 複雑なネットワーク内に配置された異種データストア間で、データ転送および同期を高速かつ安定して実行できます。
    データ分析 ビジネスニーズに基づいて相互に依存する複数のノードで構成されるデータコンピューティングプロセスを設計し、オペレーションセンターで自動的に実行することができます。
    オペレーションセンター すべてのノードとノードインスタンスを表示し、必要に応じて関連する操作を実行できます。
    Data Quality DataWorks に依存する包括的なデータ品質スキームを提供します。 たとえば、データの探索、データの比較、データ品質の監視、SQL ステートメントのスキャン、インテリジェントアラートの使用などが可能です。 詳細については、「Data Quality」をご参照ください。
    コンピューティングエンジン MaxCompute テラバイトまたはペタバイト級のデータを処理可能な、高速でフルマネージド型のデータウェアハウスソリューションです。 大規模データの高速コンピューティングに対応し、企業のコストを効果的に節約し、データのセキュリティを保証します。 詳細については、「MaxCompute について」をご参照ください。
    DataWorks のワークスペースを作成後、MaxCompute プロジェクトに関連付けます。 関連付けられていない場合、ワークスペースでコマンドを実行すると、エラー "プロジェクトがありません" が返されます。
    Realtime Compute DataWorks の Stream Studioを使用して、ストリーミングコンピューティングノードを開発できます。
    E-MapReduce E-MapReduce を使用して、DataWorks でビッグデータ処理ノードを開発できます。 詳細については、「E-MapReduce について」をご参照ください。
    Interactive Analytics DataWorks の HoloStudio を使用して内部テーブルと外部テーブルを管理し、Interactive Analytics の SQL ノードを開発できます。
    Graph Compute DataWorks の Graph Studio を使用して、Graph Compute インスタンスを管理できます。
    機械学習サービス Machine Learning Platform for AI 統計アルゴリズムを使用して大量の履歴データを学習し、ビジネス戦略を提供する経験的モデルを生成します。
  5. [エンジンの詳細]ステップでは、選択したエンジンまたはサービスのパラメーターを設定します
    エンジンまたはサービス パラメーター 説明
    MaxCompute インスタンス表示名 コンピューティングエンジンインスタンスの名前を設定します。 名前の長さは、最大 27 文字です。 先頭は英字とする必要があり、英字、アンダースコア (_)、および数字が使用できます。
    MaxCompute プロジェクト名 MaxCompute プロジェクトの名前を設定します。 デフォルトでは、DataWorks ワークスペースの名前と同じ名前が設定されます。
    MaxCompute にアクセスするアカウント MaxCompute プロジェクトにアクセスするためのアカウントを設定します。 設定可能な値は、[プライベートアカウント] および [ワークスペースの所有者] です。 [ワークスペースの所有者] に設定することを推奨します。
    リソースグループ コンピューティングリソースおよびディスククォータを設定します。
    Realtime Compute インスタンス表示名 コンピューティングエンジンインスタンスの名前を設定します。
    Realtime Compute プロジェクト ワークスペースにバインドされる、Realtime Compute プロジェクトを設定します。 Realtime Compute プロジェクトが存在しない場合は、Realtime Compute コンソールで作成します。 詳細については、「Realtime Compute の有効化とプロジェクトの作成」をご参照ください。
    E-MapReduce インスタンス表示名 コンピューティングエンジンインスタンスの名前を設定します。
    クラスター名 E-MapReduce クラスターの ID を設定します。 カスタムイメージの名前はグローバルに一意とする必要があります。
    Access ID および Access Key E-MapReduce クラスターへのアクセス権限が付与されたアカウントの AccessKey を設定します。
    クラスター ID E-MapReduce クラスターの ID (E-MapReduce コンソールで取得) を設定します。
    EmrUserID E-MapReduce クラスターを作成したユーザーの ID (E-MapReduce コンソールで取得) を設定します。
    プロジェクトID E-MapReduce クラスター内の プロジェクトの ID (E-MapReduce コンソールで取得) を設定します。
    YARN リソースキュー E-MapReduce クラスター内のリソースキューの ID (E-MapReduce コンソールで取得) を設定します。
    エンドポイント E-MapReduce クラスターのエンドポイント (E-MapReduce コンソールで取得) を設定します。
    Interactive Analytics インスタンス表示名 コンピューティングエンジンインスタンスの表示名を設定します。
    Interactive Analytics インスタンス名 Interactive Analytics インスタンスの名前を設定します。
    データベース名 Interactive Analytics データベースの名前を設定します。
    サーバー Interactive Analytics インスタンスのエンドポイントを設定します。
    ポート Interactive Analytics インスタンスのポート番号を設定します。
    Graph Compute インスタンス表示名 コンピューティングエンジンインスタンスの名前を設定します。
    Graph Compute インスタンスのバインド ワークスペースにバインドされる Graph Compute インスタンスを設定します。
    PAI GPU の使用 この機能はデフォルトで無効化されています。 この機能を使用する必要がある場合は、 [ワークスペース管理]ページで有効化します。
  6. [ワークスペースの作成]をクリックします。
    ワークスペースを作成すると、[ワークスペース]ページにワークスペースに関する情報を表示することができます。
    • ワークスペースの所有者である場合、ワークスペース内のすべてのデータはお客様に属します。 他のユーザーは、権限を付与されるまでワークスペースにアクセスすることはできません。 Alibaba Cloud アカウントで RAM ユーザーとしてワークスペースを作成する場合、ワークスペースは RAM ユーザーと Alibaba Cloud アカウントの両方に属します。
    • RAM ユーザーをワークスペースに追加すると、RAM ユーザーは、ワークスペースを RAM ユーザーとして作成する代わりにワークスペースを使用できるようにすることができます。

次のタスク

これで、ワークスペースを作成する方法の学習が終了しました。 次のチュートリアルに進み、ワークスペースメンバーを追加するか、 [クイックスタート] で説明されている操作を直接実行することができます。 クイックスタートでは、データ分析および O&M の全プロセスを習得します。