AIプラットフォーム (PAI) のデータサイエンスワークショップ (DSW) は、アルゴリズム開発者向けに調整されたAI向けワンストップ統合開発環境 (IDE) です。 DSWは、コーディング、デバッグ、タスク実行のために、ノートブック、VSCode、ターミナルなどの複数の開発環境を統合します。 DSWは、さまざまな異種コンピューティングリソースとオープンソースイメージを提供し、Object Storage Service (OSS) 、Apsara File Storage NAS (NAS) 、およびCloud Parallel File Storage (CPFS) タイプのデータセットのマウントをサポートします。 DSWインスタンスのライフサイクルを管理し、DSWを使用して開発を簡単かつ効率的に行うことができます。
特徴
柔軟性と使いやすさ
DSWは、さまざまな開発要件を満たすために、ノートブック、VSCode、ターミナルなどの組み込み開発環境を提供します。
DSWは、PyTorchやTensorFlowなどの複数のオープンソースフレームワークのイメージを提供し、カスタムイメージをサポートします。
DSWは、パブリックリソースグループ、専用リソースグループ、Lingjunリソースなど、さまざまな異種コンピューティングリソースを提供します。 DSWでリソースを柔軟に設定および管理できます。
DSWは、Python上でのR言語とSQLステートメントの記述と実行をサポートしています。
ワンストップサービス
DSWを使用すると、OSS、NAS、CPFSファイルシステムなどのファイルシステムをマウントし、MaxComputeデータにアクセスできます。
DSWは、データ処理、コーディング、デバッグ、モデルトレーニングからモデル展開まで、完全なAI開発パイプラインを実装する、ディープラーニングコンテナ (DLC) およびElastic Algorithm Service (EAS) ツールを提供します。
きめ細かい管理
DSWを使用すると、インスタンスのスケジュール停止またはアイドルインスタンスの自動停止を設定してコストを削減できます。
DSWは、CPU、GPU、およびメモリ使用量のリアルタイムモニタリングを提供し、リソース使用量をリアルタイムで分析するのに役立ちます。
シナリオベースのチュートリアル
DSWは、開発者向けのコンテンツプラットフォームとしてノートブックギャラリーを提供します。 ノートブックギャラリーでは、大規模言語モデル (LLM) およびAIコンテンツ生成関連業界向けのチュートリアルを使用して、すぐに開発を開始できます。
エンタープライズクラスの機能
DSWは、ワークスペース管理者ロールを使用してグローバルリソースを割り当て、リソース再利用ポリシーを構成します。
シナリオ
機械学習とデータサイエンス
DSWはNotebookインタラクティブプログラミング環境をサポートし、PyTorchやTensorFlowイメージなどのさまざまなイメージを提供します。 データエンジニアリング、モデルの開発とトレーニング、視覚的分析などのタスクを簡単に実行でき、リソースのO&Mや環境設定を行う必要がありません。
生成AIとLLM
Notebook Galleryは、Stable Diffusion、Llama2、Tongyi Qianwenなど、Notebookでアクセスできる一般的なシナリオでさまざまなユースケースとベストプラクティスを提供します。 DSWのチュートリアルと、チュートリアルに基づくコードを直接使用できます。
AIとビッグデータの統合
PythonおよびR言語に加えて、DSWはビッグデータ統合をサポートしています。 SQL Fileプラグインを使用して、SQL文を使用してMaxComputeデータソースのデータを照会したり、Notebookを使用してE-MapReduceクラスターに接続してSparkジョブを送信したりできます。