Do JV Roig viết
Chào mừng bạn đến với Phần 3 trong loạt bài về biện pháp triển khai AI tạo sinh trên Alibaba Cloud.
Trong phần 1 của loạt bài này, chúng ta đã tìm hiểu các bước triển khai genAI IaaS (Infrastructure as a Service) bằng cách sử dụng Elastic Compute Service (ECS)
Trong phần 2, chúng ta đã tìm hiểu các bước triển khai genAI PaaS (Platform as a Service) bằng cách sử dụng Platform for AI (PAI). So với toàn bộ hành trình trong phần 1, PAI mang đến trải nghiệm đơn giản hơn nhiều (và nhanh hơn!) khi có được điểm cuối AI tạo sinh có thể sử dụng được – và ngay lập tức đạt đến cấp độ sản xuất.
Hôm nay, chúng ta sẽ tìm hiểu về phương pháp MaaS (Model as a Service) bằng cách sử dụng Alibaba Cloud Model Studio.
Đăng nhập vào bảng điều khiển Alibaba Cloud trên web của bạn và sau đó tìm kiếm Model Studio. Nhấp vào kết quả xuất hiện (Alibaba Cloud Model Studio).
Nếu đây là lần đầu tiên của bạn, hãy kích hoạt Model Studio. Làm theo hướng dẫn trên màn hình (xuất hiện khi bạn đăng nhập vào bảng điều khiển Model Studio lần đầu tiên).
Ở góc trên bên phải, di chuột qua biểu tượng người dùng, sau đó nhấp vào API-KEY trong menu bật lên:
Nhấp vào nút Create API Key:
Khóa API mới sẽ được thêm vào bảng. Nhấp vào View bên dưới cột Actions để hiển thị toàn bộ Khóa API để sao chép và dán vào ứng dụng hoặc biến môi trường của bạn.
Tốt nhất là bạn nên giữ bí mật khóa API của mình. Nếu khóa API của bạn vô tình bị rò rỉ (ví dụ: bạn để khóa này trong mã công khai), bạn nên XÓA khóa API đó và tạo khóa mới.
Quay lại trang chủ của Model Studio. Nhấp vào “Model Gallery” ở thanh bên trái.
Các mẫu có thể sử dụng sẽ được liệt kê trong Model Gallery. Trong ví dụ này, chúng ta hãy chọn Qwen-Max. Trong Qwen-Max, nhấp vào Try.
Trang Model Experience sẽ mở ra. Bạn có thể thêm một mô hình khác để thử bên cạnh Qwen-Max. Trong lần kiểm tra này, hãy chọn Qwen-Plus:
(Bên trên: Qwen-Max và Qwen-Plus đều được chọn)
Nhập tin nhắn vào ô trò chuyện rồi nhấn Enter. Bạn sẽ thấy cả hai mô hình trả lời cùng lúc, trong đó Qwen-Max chậm hơn (vì lớn hơn nhiều) so với Qwen-Plus:
Bạn sẽ cần khóa API ở phần trước.
Trong trang Model Gallery, có một liên kết API Call Example bên dưới mỗi mô hình, liên kết này sẽ hiển thị mã mẫu để giúp bạn sử dụng mô hình này trong các ứng dụng riêng của mình:
Ở góc trên bên phải, bạn cũng sẽ thấy nút API Call Documentation để mở tài liệu API chính thức cho các mô hình trong Model Studio.
Cứ như vậy, chúng ta đã có thể bắt đầu tích hợp các tính năng genAI vào ứng dụng của mình thông qua Model Studio.
Trước tiên, chúng ta cần cài đặt SDK Alibaba Cloud Model Studio. Chúng ta sẽ sử dụng Python trong ví dụ của mình, vì vậy hãy cài đặt SDK Alibaba Cloud Model Studio cho Python thông qua pip:
pip install dashscope
Sau đây là mã mẫu tôi đã tạo, cũng từ các mẫu và tài liệu được cung cấp trực tiếp trong bảng điều khiển Model Studio:
Đây chính là ví dụ suy luận mà chúng ta đã sử dụng từ Phần 1! Còn đây là kết quả mẫu khi tôi chạy mã Python đó:
Như chúng ta mong đợi, LLM của chúng ta phản hồi như một tên cướp biển nhờ gợi ý của hệ thống và đưa ra cho chúng ta những gợi ý về kỳ nghỉ đi thuyền nhờ vào câu hỏi của chúng ta.
Vậy là xong! Đó là phương pháp dễ dàng và đơn giản để bắt đầu sử dụng AI tạo sinh bằng cách sử dụng Model Studio.
Điều hay nhất là gì? Mọi thứ đều đạt chuẩn cấp độ sản xuất ngay lập tức và hiệu suất cũng như khả năng mở rộng không còn là vấn đề gì nữa. Model Studio sẽ xử lý mọi việc đó thay chúng ta.
Và đặc biệt hơn so với các phương pháp triển khai genAI thông qua IaaS và PaaS của Model Studio, giờ đây chúng ta có thể thanh toán theo mỗi token. Thay vì thanh toán theo giờ đối với các phiên bản mà chúng ta triển khai trong ECS hoặc PAI, chúng ta chỉ thanh toán cho số lượng token thực tế mà chúng ta sử dụng. Để biết giá thực tế, hãy tham khảo tài liệu chính thức tại đây: https://www.alibabacloud.com/help/en/model-studio/developer-reference/billing-for-tongyiqianwen
GIỚI THIỆU VỀ TÁC GIẢ: JV là Kiến trúc sư giải pháp cao cấp tại Alibaba Cloud PH, lãnh đạo chiến lược AI tạo sinh và dữ liệu của đội ngũ. Nếu bạn nghĩ bất kỳ điều gì trong bài viết này có liên quan đến một số vấn đề kinh doanh hiện tại của mình, vui lòng liên hệ với JV qua jv.roig@alibaba-inc.com.
Bài viết này được dịch từ tiếng Anh. Xem bài viết gốc tại đây.
80 posts | 3 followers
FollowRegional Content Hub - August 29, 2024
Regional Content Hub - August 29, 2024
Alibaba Cloud Vietnam - January 1, 2024
Regional Content Hub - October 21, 2024
Regional Content Hub - August 5, 2024
Regional Content Hub - July 22, 2024
80 posts | 3 followers
FollowTop-performance foundation models from Alibaba Cloud
Learn MoreA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreAccelerate AI-driven business and AI model training and inference with Alibaba Cloud GPU technology
Learn MoreMore Posts by Regional Content Hub