Oleh JV Roig
Selamat datang di bagian 3 dalam seri pendekatan penyebaran AI generatif di Alibaba Cloud ini.
Di bagian 1 seri ini, kita membahas penyebaran GenAI IaaS (Infrastruktur sebagai Layanan), menggunakan Elastic Compute Service (ECS)
Di bagian 2, kita membahas penyebaran GenAI PaaS (Platform sebagai Layanan), menggunakan Platform for AI (PAI). Dibandingkan dengan seluruh perjalanan di bagian 1, PAI memberikan pengalaman yang jauh lebih mudah (dan lebih cepat!) untuk mendapatkan titik akhir AI generatif yang dapat digunakan – dan juga tingkat produksi secara langsung.
Hari ini, kita akan membahas pendekatan MaaS (Model sebagai Layanan), menggunakan Model Studio Alibaba Cloud.
Masuk ke konsol web Alibaba Cloud Anda, lalu cari Model Studio. Klik hasil yang muncul (Model Studio Alibaba Cloud).
Jika ini adalah pertama kalinya untuk Anda, silakan lanjut dan aktifkan Model Studio. Ikuti petunjuk di layar yang akan muncul ketika Anda pertama kali masuk ke konsol Model Studio.
Di sudut kanan atas, layangkan mouse ke ikon pengguna, lalu klik API-KEY di menu pop-up yang muncul:
Klik tombol Buat Kunci API:
Kunci API baru akan ditambahkan ke dalam tabel. Klik Lihat di bawah kolom Tindakan untuk menampilkan Kunci API dengan urutan lengkap untuk disalin-tempel ke variabel aplikasi atau lingkungan Anda.
Sebaiknya, jaga rahasia kunci API Anda. Jika kunci API Anda secara tidak sengaja bocor (misalnya, Anda membiarkannya di kode publik), Anda harus MENGHAPUS kunci API itu dan membuat yang baru.
Kembali ke halaman beranda Model Studio. Klik "Galeri Model" di bilah sisi kiri.
Model yang tersedia akan tercantum di Galeri Model. Untuk contoh ini, pilih Qwen-Max. Di bawah Qwen-Max, klik Coba.
Halaman Pengalaman Model akan terbuka. Anda dapat menambahkan model lain untuk dicoba selain Qwen-Max. Untuk pengujian ini, pilih Qwen-Plus:
(Di atas: Qwen-Max dan Qwen-Plus dicentang)
Ketik pesan ke dalam kotak obrolan dan tekan enter. Anda akan melihat kedua model menjawab secara bersamaan, tetapi Qwen-Max lebih lambat (karena jauh lebih besar) daripada Qwen-Plus:
Anda memerlukan kunci API Anda dari sebelumnya.
Di halaman Galeri Model, ada tautan Contoh Panggilan API di bawah setiap model, yang akan menampilkan contoh kode untuk membantu Anda menggunakan model di aplikasi Anda:
Di kanan atas Anda juga akan melihat tombol Dokumentasi Panggilan API yang akan membuka dokumentasi API resmi untuk model Model Studio.
Hanya seperti itu, kita sudah siap untuk mulai mengintegrasikan fitur GenAI ke dalam aplikasi melalui Model Studio.
Pertama, kami harus menginstal SDK Model Studio Alibaba Cloud. Kita akan menggunakan Python dalam contoh ini, jadi mari kita instal SDK Model Studio Alibaba Cloud untuk Python melalui pip:
pip install dashscope
Berikut adalah contoh kode yang saya buat, juga dari contoh dan dokumentasi yang disediakan langsung di konsol Model Studio:
Ini contoh inferensi yang sama dengan yang kita gunakan sejak Bagian 1! Dan berikut adalah contoh output saat saya menjalankan kode Python tersebut:
Seperti yang kita harapkan sekarang, LLM kita merespons seperti bajak laut berkat perintah sistem kita yang cepat, dan memberikan saran untuk liburan berbasis berlayar dari pertanyaan kita.
Dan selesai! Begitu mudah dan sederhana untuk memulai AI generatif menggunakan Model Studio.
Bagian terbaiknya? Semuanya kelas produksi secara langsung, serta performa dan skalabilitas tidak menjadi masalah. Semua itu ditangani oleh Model Studio untuk kita.
Dan yang unik di Model Studio, tidak seperti penyebaran GenAI IaaS dan PaaS, kita sekarang menikmati penagihan per-token. Alih-alih membayar tarif per jam untuk instans yang kita gunakan di ECS atau PAI, kita hanya membayar untuk token aktual yang kita konsumsi. Untuk harga aktual, baca dokumentasi resmi di sini: https://www.alibabacloud.com/help/en/model-studio/developer-reference/billing-for-tongyiqianwen
TENTANG PENULIS: JV adalah seorang Arsitek Solusi Senior di Alibaba Cloud PH, dan memimpin strategi data dan AI generatif tim. Jika Anda merasa sesuatu dalam artikel ini relevan dengan beberapa masalah bisnis Anda saat ini, silakan hubungi JV di jv.roig@alibaba-inc.com.
Artikel ini diterjemahkan dari bahasa Inggris. Lihat artikel aslinya di sini.
80 posts | 3 followers
FollowRegional Content Hub - September 2, 2024
Regional Content Hub - September 2, 2024
Regional Content Hub - May 6, 2024
Regional Content Hub - April 1, 2024
Regional Content Hub - October 21, 2024
Regional Content Hub - June 24, 2024
80 posts | 3 followers
FollowTop-performance foundation models from Alibaba Cloud
Learn MoreAccelerate AI-driven business and AI model training and inference with Alibaba Cloud GPU technology
Learn MoreAccelerate innovation with generative AI to create new business success
Learn MoreA platform that provides enterprise-level data modeling services based on machine learning algorithms to quickly meet your needs for data-driven operations.
Learn MoreMore Posts by Regional Content Hub