×
Community Blog Membangun Layanan RAG di Compute Nest dengan Model Studio Alibaba Cloud dan AnalyticDB for PostgreSQL

Membangun Layanan RAG di Compute Nest dengan Model Studio Alibaba Cloud dan AnalyticDB for PostgreSQL

Artikel ini menyediakan panduan langkah demi langkah untuk menyiapkan layanan Retrieval-Augmented Generation (RAG) menggunakan Model Studio Alibaba Cloud, Compute Nest, dan AnalyticDB for PostgreSQL.

Oleh Farruh

Tutorial ini menyediakan panduan langkah demi langkah untuk menyiapkan layanan Retrieval-Augmented Generation (RAG) menggunakan Model Studio Alibaba Cloud, Compute Nest, dan AnalyticDB for PostgreSQL. Dengan Model Studio, Anda dapat memanfaatkan Model AI tingkat atas, seperti Qwen untuk mengembangkan, menyebarkan, dan mengelola aplikasi AI dengan mudah. Penyiapan ini memastikan penanganan data yang aman dan efisien dalam perusahaan Anda, yang meningkatkan kemampuan AI dan memungkinkan kueri bahasa alami tanpa hambatan.

Pengantar

Model Studio Alibaba Cloud menyediakan platform komprehensif untuk mengembangkan aplikasi AI generatif. Dengan menggunakan Compute Nest dan AnalyticDB for PostgreSQL, Anda dapat membuat layanan Retrieval-Augmented Generation (RAG) yang aman dan efisien untuk meningkatkan kemampuan AI dalam perusahaan Anda.

Gambaran Umum Model Studio Alibaba Cloud

model_studio_features
Fitur yang ditunjukkan dalam gambar ini akan diluncurkan secara bertahap

Apa itu Model Studio?

Model Studio Alibaba Cloud adalah platform menyeluruh yang bertujuan untuk menyederhanakan pengembangan, penyebaran, dan pengelolaan model AI generatif. Dengan Akses ke model dasar terkemuka dalam industri, seperti Qwen-Max, Qwen-Plus, Qwen-Turbo, dan seri Qwen 2, Model Studio menyediakan alat untuk penyempurnaan model, evaluasi, penyebaran, dan integrasi dengan sistem perusahaan.

Kemampuan Utama Model Studio

1.  Akses yang Mudah ke Model Dasar (FM) Terkemuka:

  • Model seperti Qwen-Max, Qwen-Plus, Qwen-Turbo, dan seri Qwen 2 mendukung aplikasi Anda dengan kemampuan AI yang ditingkatkan.

2.  Alur Kerja Inferensi dan Evaluasi Model Bawaan:

  • Dukungan untuk Supervised Fine-Tuning (SFT) dan Low-Rank Adaptation (LoRA).
  • Kompresi model, akselerasi inferensi, dan alat evaluasi multi-dimensi.
  • Penyebaran model dengan satu klik.

3.  Pengembangan Aplikasi AI Generatif yang Disederhanakan:

  • Alur kerja visual untuk mengembangkan aplikasi.
  • Rekayasa prompt berbasis template.
  • API ekstensif untuk integrasi dengan sistem bisnis.

4.  Tindakan Keamanan yang Komprehensif:

  • Jaringan VPC terisolasi untuk mengamankan data.
  • alat untuk tata kelola konten dan intervensi manusia dalam pembelajaran mesin untuk memastikan praktik AI yang bertanggung jawab.

5.  Model Pihak Ketiga:

  • Dukungan untuk model pihak ketiga seperti Tongyi, yang ditunjukkan dalam fungsi Q&A, menulis, dan NL2SQL (Natural Language to SQL).

6.  Manajemen Data:

  • Pembersihan dan pengelolaan set data.
  • Retrieval-Augmented Generation (RAG) untuk pencarian dan akses data yang ditingkatkan.

7.  Model Spesifik Industri:

  • Model kustom untuk sektor seperti layanan perawatan kesehatan, keuangan, dan hukum.

8.  API dan SDK:

  • API asisten dan rangkaian SDK untuk integrasi dan pengembangan agen yang cepat.

Prasyarat

Sebelum memulai, pastikan Anda memiliki:

  • Akun Alibaba Cloud yang aktif.
  • Pemahaman tentang layanan cloud dan model AI.

Langkah 1: Penyiapan Akun Alibaba Cloud

Jika belum memiliki, daftar untuk akun Alibaba Cloud: Daftar.

Langkah 2: Akses Compute Nest

Navigasikan ke Compute Nest dan temukan layanan untuk AI Generatif: Compute Nest

model_studio_rag

Langkah 3: Siapkan Instans dan Parameternya

Konfigurasikan parameter yang diperlukan untuk instans:

  1. Nama Instant Layanan: Berikan nama yang bermakna untuk instans.
  2. Parameter Elastic Computing Services (ECS): Direkomendasikan untuk memilihecs.c6.2xlarge untuk pemrosesan dokumen yang lebih cepat.
  3. Kata Sandi Instans: Buat kata sandi yang aman untuk instans.

Instans Parameter

Langkah 4: Siapkan AnalyticDB for PostgreSQL

Konfigurasikan instans AnalyticDB for PostgreSQL:

  1. Spesifikasi Instans: Pilih spesifikasi yang sesuai berdasarkan volume data Anda.
  2. Ukuran Penyimpanan Segmen: Sesuaikan dengan kebutuhan Anda.
  3. Nama Pengguna DB: Secara defaultkbsuser, atau pilih nama pengguna Anda sendiri.
  4. Kata Sandi DB: Buat kata sandi yang kuat (jangan menggunakan simbol seperti "@").

adbpg

Langkah 5: Konfigurasikan Kredensial WebUI

Konfigurasikan kredensial Web UI untuk mengelola dan berinteraksi dengan layanan RAG Anda:

  1. Nama Pengguna: Defaultnya adalah admin, atau pilih nama pengguna lain.
  2. Kata Sandi: Buat kata sandi yang kuat dan aman.

webui

Langkah 6: Tambahkan Kunci API Model Studio

Tambahkan kunci API Model Studio Anda untuk mengautentikasi dan memfasilitasi komunikasi antarlayanan:

Kunci API: Masukkan kunci API yang Anda peroleh dari pengaturan Model Studio Anda.

model_studio_api

Ini adalah panduan cara mendapatkan Kunci API Model Studio Anda.

Langkah 7: Konfigurasi Jaringan

Pilih pengaturan jaringan yang sesuai untuk memastikan konektivitas yang aman dan andal:

Pilih Nonfigurasi Infrastruktur yang Sudah Ada

1.  Pilih apakah akan membuat VPC (Virtual Private Cloud) baru atau menggunakan yang sudah ada.

  • WhetherCreateVpc: Pilih Buat jika Anda perlu VPC baru.

2.  ID VPC: Masukkan ID VPC yang sudah ada atau buat baru.

3.  ID VSwitch: Pilih ID VSwitch yang sudah ada atau buat baru.

4.  Tag and Grup Sumber Daya:

  • Tag: Tentukan tag yang dilampirkan ke sumber daya yang dibuat.
  • Kunci Tag: Pilih kunci tag.
  • Nilai Tag: Pilih nilai label.
  • Grup Sumber Daya: Pilih grup sumber daya sebagai tempat instans layanan yang dibuat.
  • Buat Grup Sumber Daya: Ikuti petunjuk untuk Membuat Grup Sumber Daya.

Setelah mengkonfigurasi pengaturan ini, klik Berikutnya: Konfirmasikan Pesanan.

network_resources

Dengan mengikuti langkah-langkah ini, Anda akan memastikan bahwa kredensial WebUI dan pengaturan jaringan Anda dikonfigurasi dengan benar untuk mendukung layanan RAG Model Studio Alibaba Cloud Anda secara efektif.

Setelah menyiapkan parameter ini, klik Berikutnya: Konfirmasikan Pesanan.

confirm_order

Langkah 7: Integrasikan Gradio untuk Web UI

Gunakan Gradio untuk membuat antarmuka web untuk berinteraksi dengan layanan Anda:

  1. Menyiapkan Gradio: Ikuti dokumentasi Gradio untuk penginstalan dan konfigurasi.
  2. Intergrasikan Layanan: Hubungkan Gradio ke layanan backend Anda (titik akhir API Model Studio dan AnalyticDB for PostgreSQL).

Langkah 8: Sebarkan Layanan RAG Anda

Tinjau semua konfigurasi dan terima Ketentuan Layanan. Klik Buat Sekarang untuk menyebarkan layanan RAG Anda.

Sebarkan Layanan

Menggunakan Layanan RAG

Menjawab Pertanyaan Umum

Pengguna dapat mengajukan pertanyaan melalui antarmuka web Gradio, dan API Model Studio akan memberikan respons berdasarkan input.

Penggunaan Layanan

Mengunggah Dokumen untuk Retrieval-Augmentation

Pengguna dapat mengunggah dokumen yang akan disimpan di database vektor, yang meningkatkan kemampuan pengambilan model.

Mengubah Layanan

Pengguna resmi dapat mengakses instans ECS untuk membuat perubahan yang diperlukan atau pembaruan bagi layanan.

Sumber Daya Tambahan

Untuk menjelajahi lebih lanjut dan optimalkan layanan RAG Anda, periksa sumber daya berikut:

Tutorial Terkait:

Kesimpulan

Tutorial ini telah memandu Anda melalui proses komprehensif untuk membangun layanan Retrieval-Augmented Generation (RAG) menggunakan Model Studio Alibaba Cloud, Compute Nest, dan AnalyticDB for PostgreSQL. Dengan memanfaatkan rangkaian model AI generatif yang andal dari Model Studio, termasuk Qwen, Anda dapat menyederhanakan pengembangan, penyebaran, dan pengelolaan aplikasi AI di dalam perusahaan Anda. Penyiapan ini memastikan interaksi yang aman, dapat diskalakan, dan efisien, dari kueri bahasa alami hingga peningkatan pengambilan dokumen. Mengikuti langkah-langkah ini akan memungkinkan Anda memanfaatkan kemampuan AI yang canggih, dengan demikian mengubah manajemen data dan pemanfaatan dalam organisasi Anda. Untuk pengoptimalan dan dukungan yang berkelanjutan, pertimbangkan untuk menjelajahi sumber daya tambahan dan tutorial terkait yang disediakan.


Artikel ini ditulis dalam bahasa Inggris. Lihat artikel aslinya di sini.

0 0 0
Share on

Regional Content Hub

84 posts | 3 followers

You may also like

Comments

Regional Content Hub

84 posts | 3 followers

Related Products