すべてのプロダクト
Search
ドキュメントセンター

DataWorks:概要

最終更新日:Mar 01, 2026

DataWorks 管理センターは、環境の構成およびリソース管理を行うためのビジュアルプラットフォームです。テナントレベルではテナント全体に適用されるロールやアラートルールの構成が可能であり、ワークスペースレベルでは各プロジェクトごとに専用のコンピュートエンジン、データソース、メンバーの詳細な構成が可能です。

基本概念とシステムアーキテクチャー

作業を開始する前に、DataWorks の基本的なアーキテクチャーおよびエンティティ間の関係を理解しておくことが重要です。

基本概念:ワークスペース

ワークスペースは、DataWorks におけるプロジェクト管理、アクセスの制御、リソース隔離のための基本的な論理単位です。データ開発、タスク操作、メンバー管理などのすべてのアクティビティは、ワークスペース内で実行されます。

  • 隔離:ワークスペースは強力な隔離を提供します。各ワークスペースは、タスク、リソース、メンバーに関して完全に独立しています。

  • コンテナー:ワークスペースは、データ開発や Data Integration などの機能モジュールをホストし、データソース、コンピュートエンジン、リソースグループなどの外部エンティティに接続するコンテナーとして機能します。

アーキテクチャーとエンティティ間の関係

以下の図は、DataWorks のコアエンティティ間の依存関係および関係性を示しています。

image
  1. ワークスペース:アーキテクチャーの中心に位置し、すべての操作の基本単位となります。データ開発Data IntegrationO&M Centerなどの機能は、特定のワークスペース内で実行されます。

  2. リソースグループ

    説明

    DataWorks のリソースグループは、タスク実行に必要な計算リソースを提供するもので、別途購入が必要です。これは、Alibaba Cloud Resource Management のリソースグループ(Alibaba Cloud アカウント全体でのリソース隔離および権限管理に使用)とは異なる概念です。

    • 定義:タスク実行に必要な計算リソース (CPU およびメモリ) を提供するエンティティです。ワークスペースとは独立して存在します。

    • 関係性バインドが必須です。図の右側に示されているように、Data Integration タスクおよびスケジュールされたデータ開発 タスクが実行時に必要な計算リソースを取得できるよう、リソースグループを 1 つ以上のワークスペースにバインドする必要があります。

  3. コンピュートエンジン

    • 定義データ開発 モジュール向けの構文解析、コンパイル、実行環境 を提供するエンティティです。例:MaxCompute、Hologres、EMR など。

    • 関係性開発依存です。データ開発 モジュールへの入力矢印が示すように、ワークスペースにコンピュートエンジンをバインドする必要があります。これにより、開発者はデータ開発 モジュール内でコード (SQL や Spark など) を記述・デバッグ・送信できます。

  4. データソース

    • 定義:MySQL、Oracle、OSS などの外部データストアにアクセスするための接続情報を構成したものです。

    • 関係性統合依存です。Data Integration モジュールへの入力矢印が示すように、データ統合タスクのソースおよびシンクは、事前にワークスペース内に構成されたデータソースに依存します。

  5. カスタムイメージ

    • 定義:特定のオペレーティングシステム、ランタイム環境、サードパーティライブラリを含むパッケージ化された環境です。

    • 関係性必要に応じてバインドします。左側に示されているように、開発環境 (Data Studio) や特定のタイプのデータ開発 ノード (PyODPS など) が標準環境にない依存関係を必要とする場合、カスタムイメージをバインドできます。これは高度な機能です。

  6. クロスワークスペースのグローバルサービス

    • 図の上部に示されているように、Data GovernanceData Map などのモジュールはワークスペースレベルよりも上位で動作します。これらはテナントレベルのグローバルなデータビューおよび管理機能を提供します。これらの権限システムは個々のワークスペースとは独立しています。

事前準備

  • 権限:特定の操作が表示されない、または実行できない場合は、ご利用の Alibaba Cloud アカウントのオーナーまたは管理者に連絡し、必要な権限が付与されていることを確認してください。詳細については、「メンバー権限管理」をご参照ください。

  • リージョン隔離:DataWorks のワークスペースおよび関連リソースはリージョン単位で隔離されています。操作を実行する前に、コンソールの上部ナビゲーションバーで正しいリージョンを選択してください。

クイックスタート

DataWorks を初めて構成する場合は、以下の標準的なワークフローに従って、環境が完全かつ使用可能な状態になるようにしてください。

重要

必ず Alibaba Cloud アカウント、または AliyunDataWorksFullAccess ポリシーが付与された Resource Access Management (RAM) ユーザーを使用してください。そうでない場合は、管理者にRAM ユーザーへの権限付与を依頼してください。

1. ワークスペースの作成

DataWorks コンソールにログインします。上部ナビゲーションバーで対象のリージョンを選択します。左側のナビゲーションウィンドウで、ワークスペースをクリックし、次にワークスペースの作成をクリックします。ニーズに応じてワークスペースモードを選択します。開発、テスト、本番環境間の完全な隔離を実現するには、標準モードの使用を推奨します。

詳細については、「ワークスペースの作成」をご参照ください。

image

2. リソースグループの構成とバインド

  1. リソースグループの作成または購入:コンソールの左側ナビゲーションウィンドウで、リソースグループ一覧に移動します。タスクのワークロードに応じて適切なリソースグループ(例:サーバーレスリソースグループ)を購入します。

  2. リソースグループをワークスペースにバインド:このステップは、Data Integration、タスクスケジュール、DataService Studio などの主要機能を有効にするための前提条件です。

    image

3. ワークスペースへのメンバー追加

  1. ワークスペース一覧で、対象ワークスペースの [操作] 列にある詳細をクリックし、詳細ページを開きます。

  2. プロジェクトチームメンバー (RAM ユーザー) を追加し、ワークスペース管理者、開発者、O&M などの適切なワークスペースレベルのロールを割り当てます。これにより、共同開発およびアクセスの制御が可能になります。

    詳細については、「ワークスペースへのメンバー追加」をご参照ください。

    image

4. コンピュートエンジンのバインド

ワークスペースの詳細ページで、コンピューティングリソース一覧に移動し、既存のコンピュートエンジンインスタンス(例:MaxCompute プロジェクト)を現在のワークスペースにバインドします。このステップはデータ開発の前提条件です

image

5. データソースの追加

ワークスペースの詳細ページで、データソースに移動し、データソースの追加をクリックします。データ同期に必要なソースまたはシンクデータベースの接続情報を構成し、接続性をテストします。

image

以上の 5 ステップを完了すると、DataWorks ワークスペースは開発および実行の準備が整います。これで Data Integration およびデータ開発タスクを開始できます。

管理機能の概要

概要とナビゲーション

コンソールの左側ナビゲーションウィンドウは、ワークスペース一覧、リソースグループ一覧、イメージ管理、購入済みリソースおよびサービスなど、すべての管理機能へのエントリーポイントです。DataWorks コンソールにログインすると、デフォルトで概要ページが表示されます。このページでは、主要なユースケースよく使用するワークスペースプロダクトアップデートなどの情報に迅速にアクセスできます。

グローバル構成

以下の構成はテナントレベルで行われ、現在のリージョン内のすべてのワークスペースに適用されます。

  1. ナビゲーションウィンドウで その他 > 管理センター をクリックするか、ワークスペースの [操作] 列にある管理ボタンをクリックして、管理センターに移動します。

    image

  2. テナントのアラート構成テナントメンバーおよびロール拡張機能を確認します。

    image

    機能モジュール

    説明と主な操作

    アラート構成

    DataWorks のアラート連絡先に関する情報を表示・構成し、アラートクォータを設定します。

    アラートリソース:アラートリソース(SMS メッセージおよび通話)の使用量を確認し、1 日あたりのアラート上限を設定できます。上限に達すると、それ以上アラートは送信されません。
    アラート連絡先:タスクアラートを受信する連絡先を構成します。RAM から連絡先を同期するか、手動で追加できます。アラートを受信するには、連絡先を有効化する必要があります。

    詳細については、「アラート連絡先の確認と設定」をご参照ください。

    テナントメンバーおよびロール

    テナントメンバー:データセキュリティガードやデータマップなどのグローバルモジュールに対する権限を持つメンバーを構成します。
    テナントロール:グローバルロールおよびその権限を表示またはカスタマイズします。

    詳細については、「グローバルモジュールの権限制御」をご参照ください。

    拡張機能

    オープンプラットフォームから拡張アプリケーションを有効化または構成し、開発および O&M ワークフローの検証と制御を実装します。

    詳細については、「拡張機能」をご参照ください。

ワークスペース固有の構成

以下の構成は現在のワークスペースにのみ適用されます。

機能モジュール

説明と主な操作

ワークスペース設定

SELECT 文の結果をダウンロード可能にするかどうかなど、ワークスペースの基本的なプロパティおよびセキュリティ設定を管理します。

詳細については、「ワークスペースの構成」をご参照ください。

データソース

現在のワークスペースでデータ同期に使用されるソースおよびシンクの接続情報を一元的に管理します。

詳細については、「データソース管理」をご参照ください。

コンピューティングリソース

ワークスペース内のデータ開発に使用されるコンピュートエンジン(例:MaxCompute、Hologres、AnalyticDB)をバインドおよび管理します。

詳細については、「コンピュートリソース管理」をご参照ください。

クラスター管理

セルフマネージドの CDH/CDP および EMR クラスターを登録および管理します。認証ファイルおよびアカウントマッピングを構成します。これは、新しい Data Studio を使用していないワークスペースでのみ表示されます。

スペースメンバーと役割

事前定義済みロールの権限を確認します。機能権限およびコンピュートエンジンのロールマッピングを構成することで、新しいロールをカスタマイズできます。また、ワークスペースメンバーの追加または削除を行い、事前定義済みまたはカスタムロールを割り当てることも可能です。

詳細については、「ワークスペースレベルのモジュール権限制御」をご参照ください。

ワークスペース管理

コンソールの左側ナビゲーションウィンドウで、ワークスペースをクリックすると、現在のテナントおよび選択中のリージョン配下のすべてのワークスペースを表示できます。参加しているワークスペースを管理したり、新しいワークスペースを作成したりできます。

説明

RAM ユーザーは、参加しているワークスペースのみを表示できます。RAM ユーザーにワークスペースを表示させるには、そのユーザーをワークスペースメンバーとして追加する必要があります。詳細については、「ワークスペースへのメンバー追加」をご参照ください。

控制台

エリア

機能

説明

関連ドキュメント

1

リージョンの選択

DataWorks のリージョンを切り替えます。選択したリージョンに応じて、ワークスペースの一覧が変化します。

-

2

ワークスペースの作成

新しい DataWorks ワークスペースを作成します。

ワークスペースの構成

3

ワークスペースの基本情報の確認

ワークスペースのモードや管理者など、基本情報を確認します。主な情報は以下のとおりです。

  • ワークスペーステンプレート:すべての機能および OpenLake ワークスペースをサポートします。

  • モード:現在のワークスペースモード。DataWorks はシンプルモードと標準モードをサポートしています。本番開発には標準モードの使用を推奨します。

  • 管理者:ワークスペースの管理者。管理センター > ワークスペース > ワークスペースメンバーページで、管理者は RAM ユーザーをワークスペースに追加できます。

  • リソースグループ ID:現在のワークスペースに割り当てられているリソースグループ。これは、Alibaba Cloud Resource Management で作成したデフォルトリソースグループです。

    重要

    ここで表示されるリソースグループは、Alibaba Cloud アカウント配下のリソースを管理・グループ化し、リソースの整理および権限付与を簡素化するための仕組みです。これは、DataWorks のタスク実行に必要なリソースグループとは異なる概念です。Alibaba Cloud のリソースグループの詳細については、「Resource Management とは」をご参照ください。

4

ワークスペース操作

現在のワークスペースの主要メトリックを確認したり、特定のモジュールに迅速にアクセスしたり、ワークスペース関連の操作を実行したりできます。

  • 詳細:前営業日のインスタンス実行、ガバナンス課題、モデル、メトリックに関するデータを表示します。

  • クイックアクセス:現在のワークスペースに関連する機能モジュールに迅速に移動します。

  • 管理:管理センターに迅速に移動し、ワークスペースの構成やメンバー、ロール、データソース、クラスター、拡張機能の管理を行います。

  • データソースの作成:データ統合やデータ開発などの後続タスク用に、データソースを迅速に作成します。

  • コンピュートエンジンのバインド:後続のビッグデータ開発タスク用に、ワークスペースにコンピュートエンジンをバインドします。

  • ワークスペースの削除:ワークスペースを削除します。削除されたワークスペースは復元できません。

  • ワークスペースの無効化:DataWorks を今後使用しない場合、ワークスペースを無効化できます。無効化されると、ワークスペース内のタスクは自動スケジュールされなくなります。ただし、関連するエンジンリソースは引き続きアクティブなままとなり、料金が発生し続ける可能性があります。

5

エディションのアップグレード

現在の DataWorks エディションをアップグレードします。

  • 上位エディションではより多くの機能が提供されます。利用可能な機能はエディションによって異なります。

  • エディションはリージョン単位で有効化されます。エディションを購入すると、現在のリージョン内のすべてのワークスペースでその機能を利用できます。

エディション間の違いの詳細については、「DataWorks エディション別の機能詳細」をご参照ください。

専用リソースグループの購入

サーバーレスリソースグループを購入できます。購入後、左側ナビゲーションウィンドウのリソースグループをクリックして、その詳細を確認できます。

リソースグループ管理

リソースグループ

左側ナビゲーションウィンドウで、リソースグループをクリックします。対象リージョンで必要なリソースを購入したり、購入済みリソースの詳細を確認したり、管理操作を実行したりできます。

image

エリア

機能

説明

関連ドキュメント

1

リソースグループの作成

新しいサーバーレスリソースグループを作成します。

リソースグループ管理

2

リソースグループの基本情報の確認

リソースグループの実行状態、有効期限、使用量などの基本情報を確認します。

  • エリア 2、リソースグループのステータス

    • 起動中:購入後にリソースグループが起動中です。しばらくお待ちください。

    • 実行中:リソースグループが正常に実行されており、タスクを実行できます。

    • 更新中:スケーリングなどの変更が進行中です。

      説明

      更新処理には時間がかかります。しばらくお待ちください。

    • 期限切れ:サブスクリプションリソースグループが有効期限後に更新されなかった場合、ステータスは「期限切れ」となり、使用できなくなります。猶予期間内に更新されない場合、コンソールからリソースグループが削除されます。

    • 凍結:従量課金リソースグループは、7 日間連続で未使用の場合、自動的に凍結されます。

  • エリア 3、リソースグループの使用量:リソースグループの使用率が高すぎると、タスクのパフォーマンスが低下する可能性があります。特定のタスクのリソース消費を確認し、非効率にリソースを使用しているタスクを最適化してください。

3

4

リソースグループの基本操作

リソースグループの詳細情報を確認し、関連する変更操作を実行します。

  • 詳細:基本情報、リソース使用量、スケジューリング同時実行数の使用状況、および Data Integration、Data Analytics、Data Service、データスケジューリング、個別の開発環境などのモジュールでの使用状況を確認します。

  • ネットワーク設定:特殊なネットワーク環境にアクセスする必要がある場合、リソースグループのネットワークを構成する必要があります。構成前に、ネットワーク接続ソリューションを選択し、そのドキュメントを参照して手順を確認してください。

  • ワークスペースとの関連付け:リソースグループを購入した後、使用するには特定のワークスペースにバインドする必要があります。

    関連付けられたワークスペースを変更するには、ModifyResourceGroup 権限が必要です。権限付与の詳細については、「詳細なコンソールアクセス制御:カスタムポリシー」をご参照ください。

  • その他の操作: image をクリックして、リソースグループに対してスケールアウトスケールイン更新解約クォータ管理課金方法の変更データスケジューリングの同時実行数制限の変更などの操作を実行できます。

説明

リソースグループへの変更処理には時間がかかります。しばらくお待ちください。

LLM サービス

左側ナビゲーションウィンドウで、LLM 管理をクリックして LLM サービスページに移動します。LLM サービスは、効率的なデプロイメント、安全な通信、簡単なモデル呼び出しを実現するワンストップソリューションを提供します。DataWorks のサーバーレスリソースグループを使用して簡単にモデルをデプロイし、データ統合およびデータ開発タスクで直接 LLM を呼び出すことができます。詳細については、「大規模モデルサービスの管理」をご参照ください。

イメージ管理

左側ナビゲーションウィンドウで、イメージ管理をクリックして、公式の DataWorks イメージを確認します。タスクが特定の開発環境(サードパーティライブラリなど)を必要とする場合、必要な依存関係を含むカスタムイメージを作成できます。その後、サーバーレスリソースグループ上でタスクを実行する際に、このイメージをランタイム環境として選択できます。詳細については、「カスタムイメージ」をご参照ください。

購入済みリソースおよびサービス

左側ナビゲーションウィンドウで、購入済みリソースおよびサービスをクリックして、購入済みのサブスクリプションおよび従量課金の DataWorks サービスおよびリソースグループの詳細を確認します。対応する請求書および課金ルールを確認するほか、更新アップグレードダウングレード解約などの操作を実行できます。関連ドキュメントについては、「請求書の確認」および「概要」をご参照ください。