작성: Farruh
이 튜토리얼에서는 Alibaba Cloud Model Studio, Compute Nest 및 AnalyticDB for PostgreSQL을 사용하여 검색 증강 생성(RAG) 서비스를 설정하는 단계별 가이드를 제공합니다. Model Studio를 사용하면 Qwen과 같은 최고 수준의 생성형 AI 모델을 활용하여 AI 애플리케이션을 손쉽게 개발, 배포, 관리할 수 있습니다. 이러한 설정은 기업 내에서 안전하고 효율적인 데이터 처리를 보장하여 AI 기능을 향상시키고 자연어 쿼리를 원활하게 수행할 수 있도록 합니다.
Alibaba Cloud Model Studio는 생성형 AI 애플리케이션 개발을 위한 포괄적인 플랫폼을 제공합니다. Compute Nest 및 AnalyticDB for PostgreSQL을 사용하면 안전하고 효율적인 검색 증강 생성(RAG) 서비스를 구축하여 기업 내 AI 역량을 강화할 수 있습니다.
이 다이어그램에 표시된 기능은 순차적으로 출시될 예정입니다.
Alibaba Cloud Model Studio는 생성형 AI 모델의 개발, 배포, 관리를 간소화하는 것을 목표로 하는 엔드투엔드 플랫폼입니다. Model Studio는 Qwen-Max, Qwen-Plus, Qwen-Turbo, Qwen 2 시리즈와 같은 업계 최고의 기본 모델에 액세스할 수 있으며, 모델 미세 조정, 평가, 배포 및 엔터프라이즈 시스템과의 통합을 위한 도구를 제공합니다.
1. 선도적인 파운데이션 모델(FM)에 대한 간편한 액세스:
2. 내장된 모델 추론 및 평가 워크플로:
3. 간소화된 생성형 AI 애플리케이션 개발:
4. 포괄적인 보안 조치:
5. 서드파티 모델:
6. 데이터 관리:
7. 산업별 모델:
8. API 및 SDK:
시작하기 전에 다음이 필요합니다.
아직 가입하지 않았다면 Alibaba Cloud 계정에 가입합니다: 가입하기.
Compute Nest로 이동하여 생성형 AI 서비스를 찾습니다: Compute Nest
인스턴스에 필요한 파라미터를 구성합니다.
ecs.c6.2xlarge
를 선택하는 것이 좋습니다.AnalyticDB for PostgreSQL 인스턴스 구성:
kbsuser
또는 사용자 이름을 직접 선택합니다.RAG 서비스를 관리하고 상호 작용할 수 있도록 웹 UI 자격 증명을 구성합니다.
admin
이나 다른 사용자 이름을 선택합니다.Model Studio API 키를 추가하여 인증하고 서비스 간 통신을 원활하게 하십시오.
API 키: Model Studio 설정에서 얻은 API 키를 입력합니다.
다음은 Model Studio API 키 획득 방법에 대한 가이드입니다.
안전하고 안정적인 연결을 보장하기 위해 적절한 네트워크 설정을 선택합니다.
1. 새 VPC(Virtual Private Cloud)를 생성할지 아니면 기존 VPC를 사용할지 선택합니다.
Create
를 선택합니다.2. VPC ID: 기존 VPC의 ID를 입력하거나 새로 생성합니다.
3. VSwitch ID: 기존 VSwitch의 ID를 선택하거나 새로 생성합니다.
4. 태그 및 리소스 그룹:
설정을 구성한 후 다음: 주문 확인을 클릭합니다.
이 단계를 수행하면 WebUI 자격 증명 및 네트워크 설정이 올바르게 구성되어 Alibaba Cloud Model Studio RAG 서비스를 효과적으로 지원할 수 있습니다.
이러한 파라미터를 설정한 후 다음: 주문 확인을 클릭합니다.
Gradio를 사용하여 서비스와 상호 작용할 수 있는 웹 인터페이스를 만듭니다.
모든 구성을 검토하고 서비스 약관에 동의합니다. 지금 생성을 클릭하여 RAG 서비스를 배포합니다.
사용자는 Gradio 웹 인터페이스를 통해 질문을 할 수 있으며, Model Studio API는 입력에 따라 응답을 제공합니다.
사용자는 벡터 데이터베이스에 저장될 문서를 업로드하여 모델의 검색 기능을 향상시킬 수 있습니다.
권한이 부여된 사용자는 ECS 인스턴스에 액세스하여 서비스에 필요한 변경 또는 업데이트를 수행할 수 있습니다.
RAG 서비스를 더 자세히 살펴보고 최적화하려면 다음 리소스를 확인하십시오.
관련 튜토리얼:
이 튜토리얼에서는 Alibaba Cloud Model Studio, Compute Nest 및 AnalyticDB for PostgreSQL을 사용하여 검색 증강 생성(RAG) 서비스를 구축하는 포괄적인 프로세스를 안내합니다. Qwen을 포함한 Model Studio의 강력한 생성형 AI 모델 제품군을 활용하면 기업 내에서 AI 애플리케이션의 개발, 배포, 관리를 간소화할 수 있습니다. 이 설정은 자연어 쿼리부터 문서 검색 개선에 이르기까지 안전하고 확장 가능하며 효율적인 상호 작용을 보장합니다. 이 단계를 따르면 고급 AI 기능을 활용하여 조직 내 데이터 관리 및 활용을 혁신할 수 있습니다. 지속적인 최적화와 지원을 받으려면 제공된 추가 리소스 및 관련 튜토리얼을 살펴보십시오.
이 문서는 영어로 작성되었습니다. 원본 문서는 여기에서 확인하십시오.
89 posts | 3 followers
FollowRegional Content Hub - April 15, 2024
Regional Content Hub - May 20, 2024
James Lee - October 11, 2023
JJ Lim - November 10, 2021
Regional Content Hub - October 14, 2024
JJ Lim - December 3, 2021
89 posts | 3 followers
FollowAn online MPP warehousing service based on the Greenplum Database open source program
Learn MoreCloud Engine for Enterprise Applications
Learn MoreAnalyticDB for MySQL is a real-time data warehousing service that can process petabytes of data with high concurrency and low latency.
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreMore Posts by Regional Content Hub