×
Community Blog Xây dựng dịch vụ Retrieval-Augmented Generation (RAG) trên Compute Nest với Alibaba Cloud Model Studio và AnalyticDB for PostgreSQL

Xây dựng dịch vụ Retrieval-Augmented Generation (RAG) trên Compute Nest với Alibaba Cloud Model Studio và AnalyticDB for PostgreSQL

Bài viết này cung cấp hướng dẫn từng bước để thiết lập dịch vụ Retrieval-Augmented Generation (RAG) bằng cách sử dụng Alibaba Cloud Model Studio, Compute Nest và AnalyticDB for PostgreSQL.

Do Farruh viết

Bài viết này cung cấp hướng dẫn từng bước để thiết lập dịch vụ Retrieval-Augmented Generation (RAG) bằng cách sử dụng Alibaba Cloud Model Studio, Compute Nest và AnalyticDB for PostgreSQL. Với Model Studio, bạn có thể tận dụng các mô hình AI tạo sinh hàng đầu như Qwen để phát triển, triển khai và quản lý các ứng dụng AI một cách dễ dàng. Cách thiết lập này đảm bảo doanh nghiệp của bạn xử lý dữ liệu bảo mật và hiệu quả, cải thiện chức năng AI và giúp truy vấn ngôn ngữ tự nhiên liền mạch.

Giới thiệu

Alibaba Cloud Model Studio cung cấp một nền tảng toàn diện để phát triển ứng dụng AI tạo sinh. Khi sử dụng Compute Nest và AnalyticDB for PostgreSQL, bạn có thể tạo dịch vụ Retrieval-Augmented Generation (RAG) bảo mật, hiệu quả để cải thiện chức năng AI trong doanh nghiệp của mình.

Tổng quan về Alibaba Cloud Model Studio

model_studio_features
Các tính năng trong sơ đồ này sẽ được ra mắt dần dần

Model Studio là gì?

Alibaba Cloud Model Studio là nền tảng đầu cuối nhằm đơn giản hóa việc phát triển, triển khai và quản lý các mô hình AI tạo sinh. Với quyền truy cập vào các mô hình nền tảng hàng đầu trong ngành như Qwen-Max, Qwen-Plus, Qwen-Turbo và dòng Qwen 2, Model Studio cung cấp các công cụ để tinh chỉnh, đánh giá, triển khai và tích hợp mô hình với các hệ thống của doanh nghiệp.

Chức năng chính của Model Studio

1.  Dễ dàng tiếp cận mô hình nền tảng (FM) hàng đầu:

  • Các mô hình như Qwen-Max, Qwen-Plus, Qwen-Turbo và dòng Qwen 2 là nguồn cung cấp sức mạnh cho ứng dụng của bạn bằng các chức năng AI nâng cao.

2.  Quy trình suy luận và đánh giá mô hình tích hợp:

  • Hỗ trợ Supervised Fine-Tuning (SFT) và Low-Rank Adaptation (LoRA).
  • Nén mô hình, tăng tốc suy luận và các công cụ đánh giá đa chiều.
  • Triển khai mô hình chỉ bằng một cú nhấp chuột.

3.  Quy trình phát triển ứng dụng AI tạo sinh đơn giản hơn:

  • Quy trình làm việc trực quan để phát triển ứng dụng.
  • Kỹ thuật gọi ý dựa trên mẫu.
  • API mở rộng để tích hợp với hệ thống kinh doanh.

4.  Các biện pháp an ninh toàn diện:

  • Mạng VPC bị cô lập để bảo mật dữ liệu.
  • các công cụ quản trị nội dung và can thiệp của con người theo vòng lặp để đảm bảo áp dụng biện pháp AI có trách nhiệm.

5.  Mô hình của bên thứ ba:

  • Hỗ trợ cho các mô hình của bên thứ ba như Tongyi, được thể hiện trong các chức năng Hỏi đáp, viết và NL2SQL (Natural Language to SQL).

6.  Quản lý dữ liệu:

  • Dọn dẹp và quản lý tập dữ liệu.
  • Retrieval-Augmented Generation (RAG) để cải thiện khả năng truy cập dữ liệu và tìm kiếm.

7.  Các mô hình dành riêng cho ngành:

  • Mô hình tùy chỉnh cho các lĩnh vực như chăm sóc sức khỏe, tài chính và dịch vụ pháp lý.

8.  API và SDK:

  • API trợ lý và một bộ SDK để nhanh chóng tích hợp và phát triển tác nhân.

Điều kiện tiên quyết

Trước khi bắt đầu, đảm bảo bạn có:

  • Tài khoản Alibaba Cloud còn hiệu lực.
  • Quen thuộc với các dịch vụ đám mây và mô hình AI.

Bước 1: Thiết lập tài khoản Alibaba Cloud

Nếu bạn chưa đăng ký, hãy đăng ký tài khoản Alibaba Cloud:Đăng ký.

Bước 2: Truy cập Compute Nest

Điều hướng đến Compute Nest và tìm dịch vụ cho AI tạo sinh: Compute Nest

model_studio_rag

Bước 3: Thiết lập một phiên bản và các thông số tương ứng

Cấu hình các thông số cần thiết cho phiên bản:

  1. Tên phiên bản dịch vụ: Đặt tên có ý nghĩa cho phiên bản.
  2. Thông số Elastic Computing Services (ECS): Nên chọn ecs.c6.2xlarge để xử lý tài liệu nhanh hơn.
  3. Mật khẩu phiên bản: Tạo một mật khẩu bảo mật cho phiên bản.

Thông số phiên bản

Bước 4: Thiết lập AnalyticDB for PostgreSQL

Cấu hình phiên bản AnalyticDB for PostgreSQL:

  1. Thông số kỹ thuật phiên bản: Chọn thông số kỹ thuật phù hợp dựa trên khối lượng dữ liệu của bạn.
  2. Dung lượng lưu trữ phân đoạn: Điều chỉnh theo nhu cầu của bạn.
  3. Tên người dùng cơ sở dữ liệu: Theo mặc định là kbsuser, hoặc chọn tên người dùng riêng của bạn.
  4. Mật khẩu cơ sở dữ liệu: Tạo mật khẩu mạnh (tránh sử dụng các ký hiệu như "@").

adbpg

Bước 5: Cấu hình thông tin xác thực WebUI

Cấu hình thông tin xác thực giao diện người dùng web để quản lý và tương tác với dịch vụ RAG của bạn:

  1. Tên người dùng: Mặc định là admin, hoặc chọn tên người dùng khác.
  2. Mật khẩu: Tạo mật khẩu mạnh và bảo mật.

webui

Bước 6: Thêm khóa API Model Studio

Thêm khóa API Model Studio của bạn để xác thực và để giao tiếp giữa các dịch vụ dễ dàng hơn:

Khóa API: Nhập khóa API bạn nhận được từ quy trình thiết lập Model Studio của mình.

model_studio_api

Đây là hướng dẫn về cách để bạn nhận khóa API Model Studio.

Bước 7: Cấu hình mạng

Chọn cài đặt mạng thích hợp để đảm bảo kết nối bảo mật và đáng tin cậy:

Chọn cấu hình cơ sở hạ tầng hiện có

1.  Chọn tạo VPC (Đám mây riêng ảo) mới hoặc sử dụng VPC hiện có.

  • WhetherCreateVpc: Chọn Tạo nếu bạn cần VPC mới.

2.  ID VPC: Nhập ID của VPC hiện có hoặc tạo VPC mới.

3.  ID VSwitch: Chọn ID của VSwitch hiện có hoặc tạo ID mới.

4.  Thẻ và nhóm tài nguyên:

  • Thẻ: Chọn thẻ để gắn vào tài nguyên đã tạo.
  • Khóa thẻ: Chọn khóa thẻ.
  • Giá trị thẻ: Chọn giá trị thẻ.
  • Nhóm tài nguyên: Chọn nhóm tài nguyên chứa phiên bản dịch vụ đã tạo.
  • Tạo nhóm tài nguyên: Làm theo hướng dẫn để Tạo một nhóm tài nguyên.

Sau khi cấu hình các mục cài đặt này, hãy nhấp vào Next: Confirm Order.

network_resources

Bằng cách làm theo các bước này, thông tin xác thực WebUI và cài đặt mạng của bạn đảm bảo sẽ được cấu hình chính xác để hỗ trợ dịch vụ Alibaba Cloud Model Studio RAG của bạn một cách hiệu quả.

Sau khi thiết lập xong các thông số này, nhấp vào Next: Confirm Order.

confirm_order

Bước 7: Tích hợp Gradio cho giao diện người dùng web

Sử dụng Gradio để tạo giao diện web tương tác với dịch vụ của bạn:

  1. Thiết lập Gradio: Làm theo tài liệu của Gradio để cài đặt và cấu hình.
  2. Tích hợp dịch vụ: Kết nối Gradio với các dịch vụ phía hệ thống của bạn (điểm cuối API Model Studio và AnalyticDB for PostgreSQL).

Bước 8: Triển khai dịch vụ RAG của bạn

Xem lại tất cả mục cấu hình và chấp nhận Điều khoản dịch vụ. Nhấp vào Create Now để triển khai dịch vụ RAG của bạn.

Triển khai dịch vụ

Sử dụng dịch vụ RAG

Trả lời câu hỏi chung

Người dùng có thể đặt câu hỏi thông qua giao diện web Gradio và API Model Studio sẽ cung cấp câu trả lời dựa trên thông tin đầu vào.

Sử dụng dịch vụ

Tải tài liệu lên để tăng cường khả năng truy xuất

Người dùng có thể tải lên các tài liệu sẽ được lưu trữ trong cơ sở dữ liệu vector, cải thiện chức năng truy xuất của mô hình.

Sửa đổi dịch vụ

Người dùng được ủy quyền có thể truy cập phiên bản ECS để thay đổi hoặc cập nhật thông tin cần thiết đối với dịch vụ.

Tài nguyên bổ sung

Để khám phá thêm và tối ưu hóa dịch vụ RAG của bạn, hãy xem các tài nguyên sau đây:

Hướng dẫn liên quan:

Kết luận

Hướng dẫn này đã hướng dẫn bạn quy trình toàn diện để xây dựng dịch vụ Retrieval-Augmented Generation (RAG) bằng cách sử dụng Alibaba Cloud Model Studio, Compute Nest và AnalyticDB for PostgreSQL. Bằng cách tận dụng bộ mô hình AI tạo sinh mạnh mẽ của Model Studio, bao gồm Qwen, bạn có thể tinh giản quy trình phát triển, triển khai và quản lý các ứng dụng AI trong doanh nghiệp của mình. Cách thiết lập này đảm bảo hoạt động tương tác bảo mật, có thể mở rộng và hiệu quả, từ truy vấn ngôn ngữ tự nhiên đến cải tiến truy xuất tài liệu. Khi làm theo các bước này, bạn sẽ có thể khai thác các chức năng AI tiên tiến, từ đó cải tiến quy trình quản lý và sử dụng dữ liệu trong tổ chức của mình. Để được hỗ trợ và tối ưu hóa liên tục, hãy cân nhắc khám phá các tài nguyên bổ sung và hướng dẫn liên quan được cung cấp.


Bài viết này được viết bằng tiếng Anh. Xem bài viết gốc tại đây.

0 0 0
Share on

Regional Content Hub

89 posts | 3 followers

You may also like

Comments

Regional Content Hub

89 posts | 3 followers

Related Products