การสร้างบริการ RAG บน Compute Nest ด้วย Model Studio ของ Alibaba Cloud และ AnalyticDB สำหรับ PostgreSQL

บทความนี้เป็นบทความแนะนำในการตั้งค่า Retrieval-Augmented Generation (RAG) โดยใช้สตูดิโอโมเดล Alibaba Cloud, Compute Nest และ AnalyticDB สำหรับ Postgre...

โดย Farruh

บทเรียนนี้จะเป็นบทเรียนที่แนะนำการตั้งค่า Retrieval-Augmented Generation (RAG) โดยใช้ Model Studio ของ Alibaba Cloud, Compute Nest และ AnalyticDB สำหรับ PostgreSQL ทีละขั้นตอน ด้วย Model Studio นี้ คุณสามารถใช้ประโยชน์จากโมเดล Generative AI ระดับสูง เช่น Qwen เพื่อพัฒนา ปรับใช้ และจัดการแอปพลิเคชัน AI ได้อย่างง่ายดาย การตั้งค่านี้จะทำให้มั่นใจได้ว่าการจัดการข้อมูลภายในองค์กรนั้นมีปลอดภัยและมีประสิทธิภาพ อีกทั้งเพิ่มขีดความสามารถของ AI และสามารถสืบค้นด้วยภาษาธรรมชาติได้อย่างราบรื่น

บทนำ

Model Studio ของ Alibaba Cloudเป็นแพลตฟอร์มที่ครอบคลุมสำหรับการพัฒนาแอปพลิเคชั่น Generative AI เมื่อใช้ Compute Nest และ AnalyticDB สำหรับ PostgreSQL คุณสามารถสร้างบริการ Restoreal-Augmented Generation (RAG) ที่ปลอดภัยและมีประสิทธิภาพ ซึ่งสามารถเพิ่มขีดความสามารถของ AI ภายในองค์กรของคุณได้

ภาพรวมของ Model Studio ของ Alibaba Cloud

model_studio_features
ฟีเจอร์ที่แสดงในแผนภาพนี้จะค่อย ๆ ปรากฎขึ้น

Model Studio คืออะไร

Model Studio ของ Alibaba Cloudเป็นแพลตฟอร์มแบบครบวงจรที่มีจุดมุ่งหมายเพื่อทำให้การพัฒนา การปรับใช้ และการจัดการโมเดล Generative AI ง่ายขึ้น ด้วยการเข้าถึงโมเดลพื้นฐานชั้นนำของอุตสาหกรรม เช่น Qwen-Max, Qwen-Plus, Qwen-Turbo และQwen ซีรีส์2 ทำให้ Model Studio เป็นเครื่องมือสำหรับทำโมเดล Fine-tuning การประเมิน การปรับใช้ และการผสานรวมกับระบบขององค์กร

ความสามารถหลักของ Model Studio

1. ง่ายต่อการเข้าถึงโมเดลพื้นฐานชั้นนำ (FM)

โมเดลต่างๆ เช่น Qwen-Max, Qwen-Plus, Qwen-Turbo และ Qwen ซีรีส์ 2 ทำให้แอปพลิเคชันของคุณมีประสิทธิภาพยิ่งขึ้นด้วยความสามารถของ AI

2. การ Inference Built-In โมเดลและ Workflows การประเมินผล

รองรับ Supervised Fine-Tuning (SFT) และ Low-Rank Adaptation (LoRA)
เครื่องมือการบีบอัดโมเดล การเร่งการ inference และประเมินผล multi-dimensional
การ Deployment เพียงคลิกเดียว

3. การพัฒนาแอปพลิเคชัน Generative AI แบบง่าย

Visual workflows สำหรับการพัฒนาแอปพลิเคชัน
Template-based ใน Prompt Engineering
API ที่ครอบคลุมสำหรับการผสมผสานกับระบบธุรกิจ

4. มาตรการรักษาความปลอดภัยที่ครอบคลุม

เครือข่าย VPC แบบแยกสำหรับความปลอดภัยของข้อมูล
เครื่องมือสำหรับการกำกับดูแลเนื้อหาและการแทรกแซงของมนุษย์ทำให้มั่นใจได้ว่าการทำงานของ AI นั้นมีความรับผิดชอบ

5. โมเดลของบุคคลที่สามบ

รองรับโมเดลของบุคคลที่สาม เช่น Tongyi ซึ่งแสดงใน Q&A การเขียน และฟังก์ชันการทำงานของ NL2SQL (ตั้งแต่ภาษาธรรมชาติ จนถึง SQL)

6. การจัดการข้อมูล

การทำ Data Cleansingและการจัดการชุดข้อมูล
Retrieval-Augmented Generation (RAG) สำหรับเพิ่มประสิทธิภาการค้นหาและการเข้าถึงข้อมูล

7. โมเดลเฉพาะสำหรับอุตสาหกรรม

การกำหนดโมเดลสำหรับภาคส่วนต่าง ๆ เช่น การดูแลสุขภาพ การเงิน และบริการด้านกฎหมาย

8. API และ SDK

Assistant API และชุด SDK สำหรับการบูรณาการและการพัฒนาตัวแทนอย่างรวดเร็ว

ข้อกำหนดเบื้องต้น

ก่อนเริ่มต้น ตรวจสอบให้แน่ใจว่าคุณมี:

บัญชี Alibaba Cloud ที่ใช้งานอยู่
ความคุ้นเคยกับบริการคลาวด์และโมเดล AI

ขั้นตอนที่ 1 : การตั้งค่าบัญชี Alibaba Cloud

หากคุณยังไม่มีบัญชี สามารถสมัครบัญชี Alibaba Cloud ได้ที่:ลงทะเบียน.

ขั้นตอนที่ 2 : เข้าสู่ Compute Nest

ไปที่ Compute Nest และค้นหาบริการสำหรับ Generative AI: Compute Nest

model_studio_rag

ขั้นตอนที่ 3 : ตั้งค่าอินสแตนซ์และพารามิเตอร์

กำหนดค่าพารามิเตอร์ที่จำเป็นสำหรับอินสแตนซ์

ชื่อบริการอินสแตนซ์: ระบุชื่อที่มีความหมายสำหรับอินสแตนซ์
Elastic Computing Services (ECS): แนะนำให้เลือกecs.c6.2xlargeสำหรับการประมวลผลเอกสารที่เร็วขึ้น
รหัสผ่านอินสแตนซ์: สร้างรหัสผ่านที่มีความปลอดภัยสำหรับอินสแตนซ์

พารามิเตอร์อินสแตนซ์

ขั้นตอนที่4 : การตั้งค่า AnalyticDB สำหรับ PostgreSQL

กำหนดค่า AnalyticDB สำหรับอินสแตนซ์ PostgreSQL

ข้อมูลจำเพาะอินสแตนซ์: เลือกข้อกำหนดที่เหมาะสมตามปริมาณข้อมูล
ขนาด Segment Storage: ปรับตามความต้องการ
ชื่อผู้ใช้งาน DB: ให้เป็นค่าเริ่มต้นkbsuserหรือเลือกชื่อผู้ใช้งานของคุณเอง
รหัสผ่าน DB: สร้างรหัสผ่านที่คาดเดายาก (หลีกเลี่ยงการใช้สัญลักษณ์เช่น "@")

adbpg

ขั้นตอนที่ 5 : กำหนดค่าข้อมูลประจำตัว WebUI

กำหนดค่าข้อมูลประจำตัวของ WebUI เพื่อจัดการและโต้ตอบกับบริการ RAG ของคุณ

ชื่อผู้ใช้งาน: ค่าเริ่มต้นคือadminหรือเลือกชื่อผู้ใช้งานอื่นๆ
รหัสผ่าน: สร้างรหัสผ่านที่คาดเดายากและปลอดภัย

webui

ขั้นตอนที่ 6 : เพิ่มคีย์ API ของสตูดิโอโมเดล

เพิ่มคีย์ API ของสตูดิโอโมเดลของคุณเพื่อยืนยันตัวตนและอำนวยความสะดวกในการสื่อสารระหว่างบริการ

คีย์ API: ป้อนคีย์ API ที่คุณได้รับจากการตั้งค่า Model Studio ของคุณ

model_studio_api

นี่คือคำแนะนำเกี่ยวกับวิธีการขอรับคีย์ API ของ Model Studio

ขั้นตอนที่ 7 : การกำหนดค่าเครือข่าย

เลือกการตั้งค่าเครือข่ายที่เหมาะสมเพื่อให้มั่นใจได้ว่าการเชื่อมต่อมีความปลอดภัยและเชื่อถือได้

เลือกค่าพื้นฐาน (Infrastructure Configuration) ที่มีอยู่

1. เลือกว่าจะสร้าง VPC (Virtual Private Cloud) ใหม่หรือใช้ที่มีอยู่

หากสร้าง Vpc: เลือกสร้างหากคุณต้องการ VPC ใหม่

2.& nbsp;VPC ID: ป้อน ID ของ VPC ที่มีอยู่หรือสร้างใหม่

สร้าง VPC: หากสร้าง VPC ใหม่ให้ทำตามคู่มือการสร้าง Alibaba Cloud VPC

3. VSwitch ID: เลือก ID ของ VSwitch ที่มีอยู่หรือสร้างใหม่

สร้าง VSwitch: คำแนะนำมีอยู่ในคู่มือการสร้าง VSwitch

4. แท็กและ Resource Group:

แท็ก: ระบุแท็กที่แนบมากับทรัพยากรที่สร้างขึ้น
คีย์แท็ก: เลือกคีย์แท็ก
ค่าแท็ก: เลือกค่าแท็ก
Resource Group: เลือก Resource Group รที่มีอินสแตนซ์บริการที่สร้างขึ้นอยู่
สร้าง Resource Group: ทำตามคำแนะนำเพื่อสร้าง Resource Group

หลังจากตั้งค่าการตั้งค่าเหล่านี้ให้คลิกถัดไป: ยืนยันคำสั่ง

network_resources

เมื่อทำตามขั้นตอนเหล่านี้แล้ว คุณจะมั่นใจได้ว่าข้อมูลประจำตัว WebUI และการตั้งค่าเครือข่ายได้มีถูกต้องเพื่อรองรับบริการ Alibaba Cloud Model Studio RAG ได้อย่างมีประสิทธิภาพ

หลังจากตั้งค่าพารามิเตอร์เหล่านี้ให้คลิกถัดไป: ยืนยันคำสั่ง

confirm_order

ขั้นตอนที่ 7 : บูรณาการ Gradio สำหรับ WebUI

ใช้ Gradio เพื่อสร้างเว็บอินเตอร์เฟสสำหรับการโต้ตอบกับบริการของคุณ

ตั้งค่า Gradio: ทำตามเอกสารของ Gradio สำหรับการติดตั้งและการกำหนดค่า
การผสมผสานบริการ: เชื่อมต่อ Gradio กับบริการแบ็กเอนด์ของคุณ (Model Studio API endpoints และ AnalyticDB สำหรับ PostgreSQL)

ขั้นตอนที่ 8 : Deploy บริการ RAG ของคุณ

ตรวจสอบการกำหนดค่าทั้งหมดและยอมรับข้อกำหนดในการให้บริการ คลิกสร้างเดี๋ยวนี้ในการ deploy บริการ RAG ของคุณ

บริการปรับใช้

การใช้บริการ RAG

การตอบคำถามทั่วไป

ผู้ใช้สามารถถามคำถามผ่านทางเว็บอินเตอร์เฟสของ Gradio และสตูดิโอโมเดล API จะให้คำตอบตามอินพุต

การใช้บริการ

การอัปโหลดเอกสารสำหรับ Retrieval Augmentation

ผู้ใช้สามารถอัปโหลดเอกสารซึ่งจะถูกจัดเก็บไว้ในรูปแบบชุดข้อมูลแบบเวกเตอร์ ซึ่งช่วยเพิ่มความสามารถในการดึงข้อมูลของโมเดล

การปรับเปลี่ยนบริการ

ผู้ใช้ที่ได้รับอนุญาตสามารถเข้าถึงอินสแตนซ์ ECS เพื่อทำการเปลี่ยนแปลงหรืออัปเดตบริการที่จำเป็น

ทรัพยากรเพิ่มเติม

หากต้องการสำรวจและเพิ่มประสิทธิภาพบริการ RAG ของคุณเพิ่มเติม โปรดตรวจสอบแหล่งข้อมูลต่อไปนี้

บทเรียนที่เกี่ยวข้อง

บทสรุป

บทเรียนนี้แนะนำขั้นตอนในการสร้างบริการ Retrieval-Augmented Generation (RAG) โดยใช้สตูดิโอโมเดลของ Alibaba Cloud, Compute Nest และ AnalyticDB สำหรับ PostgreSQL ได้อย่างคลอบคลุม ด้วยการใช้ประโยชน์จากชุด Generative AI อันทรงพลังของ Model Studio รวมถึง Qwen คุณสามารถปรับปรุงการพัฒนา การปรับใช้ และการจัดการแอปพลิเคชัน AI ภายในองค์กรได้ การตั้งค่านี้ช่วยให้มั่นใจได้ถึง ความปลอดภัย ปรับขนาดได้ และมีประสิทธิภาพในการโต้ตอบ ตั้งแต่การสืบค้นด้วยภาษาธรรมชาติไปจนถึงการปรับปรุงการเรียกค้นเอกสาร การทำตามขั้นตอนเหล่านี้จะช่วยให้คุณสามารถใช้ประโยชน์จาก AI ขั้นสูง ซึ่งเป็นการเปลี่ยนแปลงการจัดการข้อมูลและการใช้ประโยชน์ภายในองค์กรของคุณ สำหรับการเพิ่มประสิทธิภาพและการรองรับอย่างต่อเนื่อง โปรดค้นหาแหล่งข้อมูลเพิ่มเติมและบทเรียนที่เกี่ยวข้องที่มีให้

บทความนี้ถูกเขียนเป็นภาษาอังกฤษ ตรวจสอบบทความต้นฉบับที่นี่

Community