このガイドでは、Alibaba CloudのAIプラットフォームであるPAI-EAS上の大規模言語モデル(LLM)を使用して、Retrieval-Augmented Generation(RAG)サービスを作成するプロセスを説明します。ベクトルストアとしてのAnalyticDB for PostgreSQL、Web UIとしてのGradio、オーケストレーションとしてのLangchainを使用します。
Alibaba Cloudアカウントを持っていることを確認してください。まだアカウントを作成していない場合は、こちら からサインアップしてください。
アリババクラウドのアカウントでログインし、ナビゲーションメニューからCompute Nestを見つけます。サービスGenAI-LLM-RAGにアクセスして、正式使用をクリックしてください。
必要なインスタンスのパラメータを設定します:
PAI-EAS上で事前トレーニング済みのLLMをデプロイします:
1. デフォルトのユーザー名はadminです。別のユーザー名を選択することもできます。
2. 強力なパスワードを作成する必要があります。
3. VPCは既存のVPCから選択できます。新しいVPCを作成する場合は、スライダーをアクティベートして関連情報を入力してください。
4. 「Next: Confirm Order」を押してください。
Gradioを使用してWeb UIを作成してください:
関連情報をすべて確認し、Create Nowを押して利用規約に同意すると、サービスがデプロイされます。すべてのステップが完了するまでしばらくお待ちください。
ユーザーはGradioのWeb UIを通じて質問をすることができ、LLMが処理して回答を提供します。
ユーザーはベクトルストアに変換されたドキュメントをアップロードし、AnalyticDB for PostgreSQLに保存することができます。
承認されたユーザーはECSにアクセスして、サービスを変更または更新することができます。
このガイドに従うことで、PAI-EAS、AnalyticDB、Gradio、Langchainの強力な機能を活用し、Compute Nest上で機能的なRAGサービスを構築することができるはずです。
本文はAIによって翻訳されました。ここで表明されている意見は参考までにお読みいただくものであり、必ずしもAlibaba Cloudの公式の意見を代表するものではありません。原文はこちらです。
80 posts | 3 followers
FollowRegional Content Hub - August 5, 2024
Regional Content Hub - February 26, 2024
Regional Content Hub - January 19, 2024
Regional Content Hub - March 8, 2024
Regional Content Hub - May 13, 2024
Regional Content Hub - November 4, 2024
80 posts | 3 followers
FollowA platform that provides enterprise-level data modeling services based on machine learning algorithms to quickly meet your needs for data-driven operations.
Learn MoreAnalyticDB for MySQL is a real-time data warehousing service that can process petabytes of data with high concurrency and low latency.
Learn MoreAn online MPP warehousing service based on the Greenplum Database open source program
Learn MoreOffline SDKs for visual production, such as image segmentation, video segmentation, and character recognition, based on deep learning technologies developed by Alibaba Cloud.
Learn MoreMore Posts by Regional Content Hub