By Vo Thi Phuong Anh, Alibaba Cloud Solutions Architect of Vietnam
1) PAI DSW là gì?
Data Science Workshop (DSW) cho PAI là một môi trường phát triển tích hợp (IDE) triển khai trên Alibaba Cloud. DSW cung cấp môi trường phát triển tương tác cho các nhà phát triển ở các cấp độ khác nhau.
Đặc biệt, DSW tích hợp JupyterLab mã nguồn mở và cung cấp các plug-in để phát triển tùy chỉnh. Bạn có thể khởi động Notebook trực tiếp và chạy code với Python. Với DSW bạn có thể thực hiện các dự án AI với giao diện và tính năng tương ứng với việc chạy notebook trên các IDE như Visual Studio Code, Google Colab…
2) Tạo notebook cho dự án AI với PAI DSW
PAI DSW vận hành theo từng instance, trong mỗi instance bạn có thể tạo nhiều notebook và các tác vụ đối với dự án AI của bạn. Để có thể tạo instance bạn cần có một workplace PAI (bắt buộc) và chúng tôi cũng khuyến khích bạn tạo một bucket OSS/folder trong một bucket OSS hiện có dành cho dự án của bạn trên PAI.
Từ trang console của Alibaba Cloud, tìm kiếm Machine Learning Platform for AI (PAI), vào workplace của bạn (nếu bạn chỉ có 1 workplace, PAI sẽ tự vào workplace) và chọn Interactive Modelling (DSW).
Chọn Create Instance để tạo ra một instance DSW.
Lựa chọn cấu hình các thông số sau cho instance DSW của bạn:
Nếu bạn chọn lưu dữ liệu ngay trong chính instance, bạn có thể giữ nguyên mặc định (bỏ qua) phần Storage. Nếu bạn muốn kết nối đến lưu trữ tại OSS hoặc NAS, chọn Create Dataset.
Tiếp tục cấu hình các thông số sau để kết nối đến OSS:
Sau khi hoàn tất, nhấn Submit.
Nhấn Next để tiếp tục.
Bạn sẽ có thể nhìn lại thông tin của instance một lần nữa trước khi tạo. Nếu không cần thay đổi gì, chọn Create Instance.
Bạn sẽ thấy instance đang được tạo trong danh sách instance của DSW.
Sau khi instance được tạo hoàn tất (phần Status: Running), chọn Launch để vào trang Data Science Workshop (DSW).
Tại trang này, bạn có thể thực hiện các thao tác với giao diện và tính năng tương tự như Jupyter Notebook.
Tương tự như thế, bạn có thể cài đặt thêm các thư viện, đọc data, train mô hình và thực hiện dự án AI của bạn. Trong bài viết này, chúng tôi cung cấp code mẫu cho bài toán Air Pollution Prediction và dữ liệu tại đây.
https://github.com/vtpanh/AirPollutionPrediction
50 posts | 7 followers
Follow5055118765133237 - January 17, 2023
JDP - June 18, 2021
ferdinjoe - December 26, 2023
Alibaba Cloud Indonesia - August 14, 2023
Alibaba Cloud Data Intelligence - June 18, 2024
JDP - July 31, 2020
50 posts | 7 followers
FollowA platform that provides enterprise-level data modeling services based on machine learning algorithms to quickly meet your needs for data-driven operations.
Learn MoreMore Posts by Alibaba Cloud Vietnam