작성자: JV Roig
Alibaba Cloud의 생성형 AI 배포 접근 방식 시리즈 파트 3에 오신 것을 환영합니다.
이 시리즈의 파트 1에서는 Elastic Compute Service(ECS)를 사용한 IaaS(서비스형 인프라) genAI 배포를 다루었습니다.
파트 2에서는 PAI(Platform for AI)를 사용한 PaaS(서비스형 플랫폼) genAI 배포를 다루었습니다. 파트 1의 전체 여정과 비교했을 때, PAI는 훨씬 더 쉽고 빠르게 사용 가능한 생성형 AI 엔드포인트를 확보할 수 있는 환경을 제공했으며 즉시 프로덕션 등급으로도 사용할 수 있었습니다.
오늘은 Alibaba Cloud Model Studio를 사용하여 MaaS(서비스형 모델) 접근 방식을 살펴보겠습니다.
Alibaba Cloud 웹 콘솔에 로그인한 다음 Model Studio를 검색합니다. 표시되는 결과(Alibaba Cloud Model Studio)를 클릭합니다.
처음 사용하는 경우 Model Studio를 활성화합니다. Model Studio 콘솔에 처음 들어갈 때 표시되는 화면의 지침을 따릅니다.
오른쪽 상단의 사용자 아이콘 위로 마우스를 가져간 다음 팝업 메뉴가 나타나면 API-KEY를 클릭합니다.
Create API Key 버튼을 클릭합니다.
새 API 키가 테이블에 추가됩니다. Actions 열 아래의 View를 클릭하면 API 키 전체가 표시되어 애플리케이션이나 환경 변수에 복사하여 붙여넣을 수 있습니다.
API 키는 비밀로 유지하는 것이 좋습니다. API 키가 실수로 유출된 경우(예: 공개 코드에 남긴 경우) 해당 API 키를 삭제하고 새 키를 만들어야 합니다.
Model Studio 홈 페이지로 돌아갑니다. 왼쪽 사이드바에서 'Model Gallery'를 클릭합니다.
사용 가능한 모델은 Model Gallery에 나열됩니다. 이 예에서는 Qwen-Max를 선택하겠습니다. Qwen-Max 아래에서 Try를 클릭합니다.
Model Experience 페이지가 열립니다. Qwen-Max 옆에 시도할 다른 모델을 추가할 수 있습니다. 이 테스트에서는 Qwen-Plus를 선택합니다.
(위: Qwen-Max와 Qwen-Plus 모두 선택됨).
채팅 박스에 메시지를 입력하고 Enter 키를 누릅니다. 두 모델이 동시에 응답하는 것을 볼 수 있으며, Qwen-Max가 Qwen-Plus보다 훨씬 더 느립니다(훨씬 크기 때문에).
앞서 생성한 API 키가 필요합니다.
Model Gallery 페이지의 각 모델 아래에는 API Call Example 링크가 있으며, 여기에는 애플리케이션에서 모델을 사용하는 데 도움이 되는 샘플 코드가 표시됩니다.
오른쪽 상단에는 Model Studio 모델에 대한 공식 API 설명서를 여는 API Call Documentation 버튼도 있습니다.
이제 Model Studio를 통해 genAI 기능을 애플리케이션에 통합할 준비가 되었습니다.
먼저 Alibaba Cloud Model Studio SDK를 설치해야 합니다. 이 예시에서는 Python을 사용하므로 pip를 통해 Python용 Alibaba Cloud Model Studio SDK를 설치해 보겠습니다.
pip install dashscope
다음은 Model Studio 콘솔에서 직접 제공하는 샘플과 설명서에서 제가 만든 샘플 코드입니다.
파트 1부터 사용했던 것과 동일한 추론 예제입니다! 그리고 이 Python 코드를 실행했을 때의 샘플 출력은 다음과 같습니다.
지금쯤 예상했겠지만, 시스템 프롬프트 덕분에 LLM이 해적처럼 응답하고, 질문 덕분에 항해 휴가에 대한 제안을 해주고 있습니다.
여기까지입니다! Model Studio를 사용하여 생성형 AI를 시작하는 것이 이렇게 쉽고 간단합니다.
가장 좋은 점은? 모든 것이 즉시 프로덕션 등급으로 제공되며 성능과 확장성은 문제가 되지 않습니다. 이 모든 것은 Model Studio에서 처리합니다.
또한 Model Studio는 IaaS 및 PaaS genAI 배포와 달리 토큰당 과금 방식을 채택하고 있습니다. ECS 또는 PAI에 배포한 인스턴스에 대해 시간당 요금을 지불하는 대신 실제 사용한 토큰에 대해서만 비용을 지불합니다. 실제 요금은 여기에서 공식 문서를 참조하세요: https://www.alibabacloud.com/help/en/model-studio/developer-reference/billing-for-tongyiqianwen
저자 소개: JV는 Alibaba Cloud PH의 선임 솔루션 아키텍트이며 팀의 데이터 및 생성형 AI 전략을 이끌고 있습니다. 이 글의 내용이 현재 비즈니스 문제와 관련이 있다고 생각되면 jv.roig@alibaba-inc.com로 JV에게 문의해 주세요.
본 기사의 원본은 영문으로 작성되었습니다. 원본 문서 여기 참조.
89 posts | 3 followers
FollowRegional Content Hub - September 9, 2024
Regional Content Hub - December 9, 2024
Regional Content Hub - April 15, 2024
Regional Content Hub - September 9, 2024
Regional Content Hub - October 14, 2024
Regional Content Hub - July 29, 2024
89 posts | 3 followers
FollowTop-performance foundation models from Alibaba Cloud
Learn MoreA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreAccelerate AI-driven business and AI model training and inference with Alibaba Cloud GPU technology
Learn MoreMore Posts by Regional Content Hub