本記事の作成者:Farruh
このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、および AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築する方法について詳しく説明します。 Model Studio を使用すると、Qwen などの上位層の生成 AI モデルを活用して AI アプリケーションを簡単に開発、デプロイ、管理できます。 このサービスを構築することにより、企業内での安全で効率的なデータ処理が保証され、AI 機能が強化され、シームレスな自然言語クエリが可能になります。
Alibaba Cloud Model Studio は、生成 AI アプリケーションを開発するための包括的なプラットフォームです。 Compute Nest と AnalyticDB for PostgreSQL を使用すると、安全で効率的な検索拡張生成 (RAG) サービスを作成して、企業内の AI 機能を強化できます。
上図にに示す機能は順次リリース予定です。
Alibaba Cloud Model Studio は、生成 AI モデルの開発、デプロイ、管理を簡素化することを目的としたエンドツーエンドのプラットフォームです。 Qwen-Max、Qwen-Plus、Qwen-Turbo、Qwen 2 シリーズなど、業界をリードする基盤モデルにアクセス可能な Model Studio には、モデルのファインチューニング、評価、デプロイ、およびエンタープライズシステムとの統合のためのツールが用意されています。
1. 主要な基盤モデル (FM) に簡単にアクセス:
2. 組み込みのモデル推論および評価ワークフロー:
3. 生成 AI アプリケーションの開発を簡素化:
4. 広範なセキュリティ対策:
5. サードパーティのモデル:
6. データ管理:
7. 業界特化型モデル:
8. API と SDK:
開始前に、以下の事項を確認してください。
Alibaba Cloud アカウントの作成が済んでいない場合は作成します:アカウントを作成する
Compute Nest に移動して、生成 AI 用のサービスを確認します: Compute Nest
インスタンスに対して必要なパラメーターを設定します。
ecs.c6.2xlarge
を選択することを推奨します。AnalyticDB for PostgreSQL インスタンスを設定します。
kbsuser
です。独自のユーザー名も選択できます。RAG サービスを管理し、サービスと対話するための Web UI 資格情報を設定します。
admin
です。別のユーザー名も選択できます。サービス間の通信を認証し、容易に実行するために、Model Studio API キーを追加します。
API キー:Model Studio のセットアップから取得した API キーを入力します。
Model Studio API キーを取得する方法はこちらをご参照ください。
安全で信頼性の高い接続を確保するために、適切なネットワーク設定を選択します。
1. 新しい VPC (Virtual Private Cloud) を作成するか、または既存の VPC を使用するかを選択します。
[作成]
を選択します。2. VPC ID:既存の VPC の ID を入力するか、または新しい VPC を作成します。
3. VSwitch ID:既存の vSwitch の ID を選択するか、または新しい vSwitch を作成します。
4. タグとリソースグループ:
設定後、[次へ:注文の確認] をクリックします。
これらの手順に従うことにより、Alibaba Cloud Model Studio RAGサービスを効果的にサポートするために、WebUI の資格情報とネットワーク設定を正しく設定できます。
パラメーターの設定後、[次へ:注文の確認] をクリックします。
Gradio を使用して、サービスと対話するための Web インターフェースを作成します。
すべての設定項目を確認し、利用規約に同意します。 [今すぐ作成] をクリックして、RAG サービスをデプロイします。
ユーザーは Gradio Web インターフェース経由で質問をすることができ、Model Studio API は入力に基づいて応答を返します。
ユーザーは、ベクトルデータベースに保存されるドキュメントをアップロードして、モデルの検索機能を強化できます。
許可されたユーザーは、ECS インスタンスにアクセスして、サービスに必要な変更や更新を加えることができます。
RAG サービスをさらに理解して最適化するには、以下のリソースをご確認ください。
関連チュートリアル:
このチュートリアルでは、Alibaba Cloud Model Studio、Compute Nest、AnalyticDB for PostgreSQL を使用して、検索拡張生成 (RAG) サービスを構築するプロセス全体について説明しました。 Qwen を含む Model Studio の強力な生成 AI モデルを活用することで、自社での AI アプリケーションの開発、デプロイ、管理を合理化できます。 今回のようなサービスを構築することより、自然言語クエリからドキュメント検索の拡張まで、安全でスケーラブル、かつ効率的な対話が保証されます。 これらの手順に従うことで、高度な AI 機能を利用できるようになり、組織内でのデータ管理と利用を変革できます。 継続的な最適化とサポートについては、追加のリソースと関連チュートリアルをご参照ください。
この記事は英語から翻訳されました。 元の記事はこちらで確認できます。
91 posts | 3 followers
FollowRegional Content Hub - February 1, 2024
Regional Content Hub - May 13, 2024
Regional Content Hub - February 26, 2024
Regional Content Hub - March 8, 2024
Alibaba Cloud Japan - August 7, 2024
Regional Content Hub - January 19, 2024
91 posts | 3 followers
FollowAn online MPP warehousing service based on the Greenplum Database open source program
Learn MoreCloud Engine for Enterprise Applications
Learn MoreAnalyticDB for MySQL is a real-time data warehousing service that can process petabytes of data with high concurrency and low latency.
Learn MoreAlibaba Cloud PolarDB for PostgreSQL is an in-house relational database service 100% compatible with PostgreSQL and highly compatible with the Oracle syntax.
Learn MoreMore Posts by Regional Content Hub
Santhakumar Munuswamy August 5, 2024 at 6:52 am
Thanks for the sharing