
このガイドでは、Alibaba CloudのAIプラットフォームであるPAI-EAS上の大規模言語モデル(LLM)を使用して、Retrieval-Augmented Generation(RAG)サービスを作成するプロセスを説明します。ベクトルストアとしてのAnalyticDB for PostgreSQL、Web UIとしてのGradio、オーケストレーションとしてのLangchainを使用します。
Alibaba Cloudアカウントを持っていることを確認してください。まだアカウントを作成していない場合は、こちら からサインアップしてください。
アリババクラウドのアカウントでログインし、ナビゲーションメニューからCompute Nestを見つけます。サービスGenAI-LLM-RAGにアクセスして、正式使用をクリックしてください。

必要なインスタンスのパラメータを設定します:

PAI-EAS上で事前トレーニング済みのLLMをデプロイします:


1. デフォルトのユーザー名はadminです。別のユーザー名を選択することもできます。
2. 強力なパスワードを作成する必要があります。

3. VPCは既存のVPCから選択できます。新しいVPCを作成する場合は、スライダーをアクティベートして関連情報を入力してください。
4. 「Next: Confirm Order」を押してください。

Gradioを使用してWeb UIを作成してください:
関連情報をすべて確認し、Create Nowを押して利用規約に同意すると、サービスがデプロイされます。すべてのステップが完了するまでしばらくお待ちください。


ユーザーはGradioのWeb UIを通じて質問をすることができ、LLMが処理して回答を提供します。
ユーザーはベクトルストアに変換されたドキュメントをアップロードし、AnalyticDB for PostgreSQLに保存することができます。
承認されたユーザーはECSにアクセスして、サービスを変更または更新することができます。
このガイドに従うことで、PAI-EAS、AnalyticDB、Gradio、Langchainの強力な機能を活用し、Compute Nest上で機能的なRAGサービスを構築することができるはずです。
本文はAIによって翻訳されました。ここで表明されている意見は参考までにお読みいただくものであり、必ずしもAlibaba Cloudの公式の意見を代表するものではありません。原文はこちらです。
129 posts | 4 followers
FollowRegional Content Hub - August 5, 2024
Regional Content Hub - February 26, 2024
Regional Content Hub - March 8, 2024
Regional Content Hub - January 19, 2024
Alibaba Cloud Native Community - February 26, 2025
Regional Content Hub - July 7, 2025
129 posts | 4 followers
Follow
Container Service for Kubernetes
Alibaba Cloud Container Service for Kubernetes is a fully managed cloud container management service that supports native Kubernetes and integrates with other Alibaba Cloud products.
Learn More
Container Compute Service (ACS)
A cloud computing service that provides container compute resources that comply with the container specifications of Kubernetes
Learn More
Platform For AI
A platform that provides enterprise-level data modeling services based on machine learning algorithms to quickly meet your needs for data-driven operations.
Learn More
AnalyticDB for MySQL
AnalyticDB for MySQL is a real-time data warehousing service that can process petabytes of data with high concurrency and low latency.
Learn MoreMore Posts by Regional Content Hub