このトピックでは、ノードがスケジュールされた時間に実行され、タイムリーなデータ出力が要求されるビジネスシナリオにおいて、購入プランを選択する方法について説明します。
- 共有リソースグループは、デフォルトのリソースグループです。
- DataWorks テナントがノードを実行するピーク時間は、毎日 00:00〜09:00 です。 ピーク時にデフォルトのリソースグループを使用する場合は、他のテナントとリソースを共有します。
- テナントがリソースを共有すると、一部のテナントがリソースをプリエンプトする場合があります。 ノードを時間内に完了する必要がある場合は、排他的リソースグループを使用してノードを実行します。 DataWorks では、排他的リソースグループで実行されるノードインスタンスに対して追加料金が課金されません。 詳細については、「排他的リソースモード」をご参照ください。
シナリオ 1:毎日スケジュールされた時間にノードを実行する
- 説明
企業のデータウェアハウスをクラウドに移行した後、数百のノードをスケジューリングするための基本的なスケジューリングシステム、およびコストの制御が必要になります。
- 分析
Alibaba Cloud の MaxCompute や Flink などのビッグデータコンピューティングエンジンを使用する場合、ほとんどの企業は、ノードの依存関係とスケジュール時刻に基づいてデータ生成ノード (コード) をスケジュールするための安定した信頼性の高いスケジューリングシステムを必要とします。 企業が独自にシステムを開発する場合、多くの人件費と保守コストが消費されます。
- 購入プラン
必須:DataWorks (従量課金)。 詳細については、「従量課金」をご参照ください。
DataWorks (従量課金) を購入すると、DataWorks Basic Edition の機能を無料で使用できます。 この場合、毎日の基本のノードスケジューリング機能だけでなく、すべての DataWorks サービスの基本機能も使用して、オールインワンのデータ開発プロセスを低コストで完了できます。 DataWorks サービスの機能の詳細については、「DataWorks エディション別機能比較」をご参照ください。
シナリオ 2:特定の数のインスタンスを毎日同時に実行する
- 説明
ビジネス要件のため、毎朝 9 時にレポートを表示する必要があります。
- 分析
データ出力の適時性に対する強い需要があるビジネスシナリオでは、祖先ノードが実行された後、指定された時間に子孫ノードを実行する必要があります。
- 購入プラン
- 必須:DataWorks (従量課金) および DataWorks スケジューリング専用リソース (サブスクリプション) 。
- 任意:DataWorks アドバンストエディション。 必要に応じて、Standard Edition、Professional Edition、Enterprise Edition、または Ultimate Edition を購入できます。
シナリオ 3:特定の数のインスタンスを毎日同時に実行し、複数のスレッドを介して同時にデータを送信する
- 説明
ビジネスニーズに応じるため、毎朝 9 時にレポートを表示する必要があります。 メインコンテンツには、Content Delivery Network (CDN) アクセスログとクライアントデバイスタイプが含まれます。 生データは、O&M エンジニアが管理する Relational Database Service (RDS) のデータベースに保存されます。 毎日のデータ増分は約 30 GB です。 したがって、データ同期が必要です。
- 分析
シナリオ 2 に基づき、シナリオ 3 では多数の同期ノードの適時性要件が追加されます。 したがって、同期ノードがスケジュールどおりに実行されるようにすることに加えて、複数のスレッドを介した同時データ転送をサポートするために、固定されたコンピューティングおよびネットワークリソースをデプロイする必要があります。
- 購入プラン
- 必須:DataWorks (従量課金)、スケジューリング用 DataWorks 専用リソース、Data Integration 用 DataWorks 専用リソース。
1,500 のコンピューティングノードと 600 の Data Integration ノードが毎日実行され、異なるタイプのノードが異なる期間に実行されると想定します。 この場合は次のように課金されます。
コンピューティングノード
- サポートするビジネスボリューム:1,500 インスタンス
- 通常の実行時間:インスタンスごとに 30 分
- 予想される実行期間:03:00〜 8:00、合計 5 時間
- 課金:
同時に実行するインスタンスの数:(1,500 × 30)/(5 × 60) = 150
必要なスケジューリング用専用リソース:5 × 8c16g (「スケジューリング専用リソースの課金基準」に基づいて計算)
Data Integration ノード
- サポートするビジネスボリューム:600 インスタンスおよびインスタンスごとに 2 つの同時スレッド、合計 1,200 スレッド
- 通常の実行時間:インスタンスごとに 30 分
- 予想される実行期間:00:30〜03:00、合計 2.5 時間
- 課金:
同時に実行するインスタンスの数:(600 × 30)/(2.5 × 60) = 120。
必要なスケジューリング用専用リソース:4 × 8c16g (「スケジューリング専用リソースの課金基準」に基づいて計算)
同時に実行するスレッドの数:(1,200 × 30)/(2.5 × 60) = 240
必要な Data Integration 用専用リソース:4 × 32c64g (「Data Integration インスタンスの排他的リソースの課金基準」に基づいて計算)
注 上記の結果は、ビジネスボリュームと予想される実行期間に基づいて計算されます。 実際のビジネスボリュームに基づいて、購入する数量を調整することを推奨します。 - 任意:DataWorks のアドバンスエディション (サブスクリプション) 必要に応じて、Standard Edition、Professional Edition、Enterprise Edition、または Ultimate Edition を購入できます。
- 必須:DataWorks (従量課金)、スケジューリング用 DataWorks 専用リソース、Data Integration 用 DataWorks 専用リソース。
購入説明
- DataWorks のオペレーションセンターで実行されるノードには、スケジューリングのためのコンピューティングリソースが必要です。 ノードが Data Integration ノードである場合、データ転送用にスケジューリングリソースを追加する必要があります。 したがって、ノードの適切な実行を保証するために、スケジューリング用の専用リソースと Data Integration 用の専用リソースの両方を購入できます。
- Data Integration 用 DataWorks 専用リソースは、Data Integration ノードで十分な数の同時スレッドが同時に開始できることを保証できますが、同期レートを保証することはできません。
- DataWorks (従量課金) は、スケジューリングに共有リソースグループを使用します。 購入した場合、ピーク時にスケジュールどおりにすべてのノードを実行できるとは限りません。 詳細については、「従量課金」をご参照ください。
- DataWorks Standard Edition 以降は、インテリジェントモニタリング機能をサポートしています。 モニタリングルールを構成すると、世界中の大規模なワークフローをモニターし、すべてのノードが時間どおりに完了することを保証できます。 詳細については、「概要」をご参照ください。