×
Community Blog Alibaba Cloud Model Studio と AnalyticDB for PostgreSQL を使用した、Compute Nest での検索拡張生成 (RAG) サービスの構築

Alibaba Cloud Model Studio と AnalyticDB for PostgreSQL を使用した、Compute Nest での検索拡張生成 (RAG) サービスの構築

この記事では、Alibaba Cloud Model Studio、Compute Nest、および AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築する方法について詳しく説明します。

本記事の作成者:Farruh

このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、および AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築する方法について詳しく説明します。 Model Studio を使用すると、Qwen などの上位層の生成 AI モデルを活用して AI アプリケーションを簡単に開発、デプロイ、管理できます。 このサービスを構築することにより、企業内での安全で効率的なデータ処理が保証され、AI 機能が強化され、シームレスな自然言語クエリが可能になります。

はじめに

Alibaba Cloud Model Studio は、生成 AI アプリケーションを開発するための包括的なプラットフォームです。 Compute Nest と AnalyticDB for PostgreSQL を使用すると、安全で効率的な検索拡張生成 (RAG) サービスを作成して、企業内の AI 機能を強化できます。

Alibaba Cloud Model Studio の概要

model_studio_features
上図にに示す機能は順次リリース予定です。

Model Studio とは

Alibaba Cloud Model Studio は、生成 AI モデルの開発、デプロイ、管理を簡素化することを目的としたエンドツーエンドのプラットフォームです。 Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen 2 シリーズなど、業界をリードする基盤モデルにアクセス可能な Model Studio には、モデルのファインチューニング、評価、デプロイ、およびエンタープライズシステムとの統合のためのツールが用意されています。

Model Studio の主な機能

1.  主要な基盤モデル (FM) に簡単にアクセス

  • Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen 2 シリーズなどのモデルは、拡張された AI 機能でアプリケーションを強化します。

2.  組み込みのモデル推論および評価ワークフロー

  • 教師ありファインチューニング (SFT) および低ランク適応 (LoRA) がサポートされています。
  • モデル圧縮、推論アクセラレーション、および多次元評価ツールを備えています。
  • ワンクリックでモデルをデプロイできます。

3.  生成 AI アプリケーションの開発を簡素化

  • 視覚的なワークフローでアプリケーションを開発できます。
  • テンプレートを用いてプロンプトエンジニアリングを実行できます。
  • ビジネスシステムと統合するための、豊富な API が用意されています。

4.  広範なセキュリティ対策

  • 分離された VPC ネットワークでデータが保護されます。
  • 責任ある AI を確実に実践するためのコンテンツガバナンスとヒューマンインザループ介入のためのツールが用意されています。

5.  サードパーティのモデル

  • Q&A、執筆、NL2SQL (自然言語から SQL への変換) 機能などで使用される Tongyi などのサードパーティモデルがサポートされています。

6.  データ管理

  • データセットのクレンジングと管理を実行できます。
  • 検索拡張生成 (RAG) で検索とデータアクセスを強化できます。

7.  業界特化型モデル

  • ヘルスケア、金融、法律サービスなど、各業界向けののカスタムモデルが用意されています。

8.  API と SDK:

  • 迅速な統合とエージェント開発のためのアシスタント API と SDK 一式が用意されています。

前提条件

開始前に、以下の事項を確認してください。

  • Alibaba Cloud アカウントが作成済みである必要があります。
  • クラウドサービスと AI モデルについての知識が必要です。

ステップ 1:Alibaba Cloudアカウントのセットアップ

Alibaba Cloud アカウントの作成が済んでいない場合は作成します:アカウントを作成する

ステップ 2:Compute Nest にアクセス

Compute Nest に移動して、生成 AI 用のサービスを確認します: Compute Nest

model_studio_rag

ステップ 3:インスタンスとパラメーターの設定

インスタンスに対して必要なパラメーターを設定します。

  1. サービスインスタンス名:分かりやすいインスタンス名を指定します。
  2. Elastic Computing Services (ECS) パラメーター:ドキュメント処理を高速化するには、ecs.c6.2xlarge を選択することを推奨します。
  3. インスタンスパスワード:インスタンス用に安全なパスワードを作成します。

インスタンスパラメーター

ステップ 4:AnalyticDB for PostgreSQL のセットアップ

AnalyticDB for PostgreSQL インスタンスを設定します。

  1. インスタンス仕様:データ量に基づいて適切な仕様を選択します。
  2. セグメントストレージサイズ:必要に応じて調整します。
  3. DB ユーザー名:デフォルトは kbsuser です。独自のユーザー名も選択できます。
  4. DB パスワード:強力なパスワードを作成します 。記号 (@ など) は使用しないでください。

adbpg

ステップ 5:WebUI 資格情報の設定

RAG サービスを管理し、サービスと対話するための Web UI 資格情報を設定します。

  1. ユーザー名:デフォルトは adminです。別のユーザー名も選択できます。
  2. パスワード:強力で安全なパスワードを作成します。

webui

ステップ 6:Model Studio API キーの追加

サービス間の通信を認証し、容易に実行するために、Model Studio API キーを追加します。

API キー:Model Studio のセットアップから取得した API キーを入力します。

model_studio_api

Model Studio API キーを取得する方法はこちらをご参照ください。

ステップ 7:ネットワーク設定

安全で信頼性の高い接続を確保するために、適切なネットワーク設定を選択します。

既存のインフラストラクチャ設定の選択

1. 新しい VPC (Virtual Private Cloud) を作成するか、または既存の VPC を使用するかを選択します。

  • WhetherCreateVpc:新しい VPC が必要な場合は、[作成] を選択します。

2. VPC ID:既存の VPC の ID を入力するか、または新しい VPC を作成します。

3. VSwitch ID:既存の vSwitch の ID を選択するか、または新しい vSwitch を作成します。

4. タグとリソースグループ:

  • タグ:作成したリソースに付加されているタグを指定します。
  • タグキー:タグキーを選択します。
  • タグ値:タグ値を選択します。
  • リソースグループ:作成したサービスインスタンスが属するリソースグループを選択します。
  • リソースグループの作成:「リソースグループの作成」の手順に従います。

設定後、[次へ:注文の確認] をクリックします。

network_resources

これらの手順に従うことにより、Alibaba Cloud Model Studio RAGサービスを効果的にサポートするために、WebUI の資格情報とネットワーク設定を正しく設定できます。

パラメーターの設定後、[次へ:注文の確認] をクリックします。

confirm_order

ステップ 7:Gradio for Web UI の統合

Gradio を使用して、サービスと対話するための Web インターフェースを作成します。

  1. Gradio の設定:インストールと設定については、Gradio のドキュメントに従ってください。
  2. サービスの統合:Gladio をバックエンドサービス (Model Studio API エンドポイントおよび AnalyticDB for PostgreSQL) に接続します。

ステップ 8:RAG サービスのデプロイ

すべての設定項目を確認し、利用規約に同意します。 [今すぐ作成] をクリックして、RAG サービスをデプロイします。

サービスのデプロイ

RAG サービスの使用

一般的な質問への回答

ユーザーは Gradio Web インターフェース経由で質問をすることができ、Model Studio API は入力に基づいて応答を返します。

サービスの使用

検索拡張のためのドキュメントのアップロード

ユーザーは、ベクトルデータベースに保存されるドキュメントをアップロードして、モデルの検索機能を強化できます。

サービスの変更

許可されたユーザーは、ECS インスタンスにアクセスして、サービスに必要な変更や更新を加えることができます。

追加リソース

RAG サービスをさらに理解して最適化するには、以下のリソースをご確認ください。

関連チュートリアル:

結論

このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築するプロセス全体について説明しました。 Qwen を含む Model Studio の強力な生成 AI モデルを活用することで、自社での AI アプリケーションの開発、デプロイ、管理を合理化できます。 今回のようなサービスを構築することより、自然言語クエリからドキュメント検索の拡張まで、安全でスケーラブル、かつ効率的な対話が保証されます。 これらの手順に従うことで、高度な AI 機能を利用できるようになり、組織内でのデータ管理と利用を変革できます。 継続的な最適化とサポートについては、追加のリソースと関連チュートリアルをご参照ください。


この記事は英語から翻訳されました。 元の記事はこちらで確認できます。

1 0 0
Share on

Regional Content Hub

80 posts | 3 followers

You may also like

Comments

Santhakumar Munuswamy August 5, 2024 at 6:52 am

Thanks for the sharing

Regional Content Hub

80 posts | 3 followers

Related Products