Oleh Jawad
Di zaman digital saat ini, mengelola dan mengekstrak informasi dari konten visual sangat penting, terutama untuk perpustakaan, toko buku, dan koleksi pribadi. Memanfaatkan penyimpanan cloud dan teknologi AI dapat menyederhanakan proses ini secara drastis.
Di blog ini, kami akan memandu Anda dalam membuat sistem katalog yang membaca gambar sampul buku yang tersimpan di bucket OSS Alibaba Cloud dan menghasilkan file CSV (katalog) dengan perincian seperti judul buku, penulis, dan penerbit. Pendekatan ini menggabungkan kekuatan Alibaba Cloud OSS untuk penyimpanan yang dapat diskalakan dan model Qwen-VL-Plus di Model Studio untuk ekstraksi informasi cerdas dari gambar. Untuk melihat cara kerjanya, tonton video ini.
Apa itu OSS Alibaba Cloud?
Membuat Bucket OSS
Mengunggah gambar
Model Studio Alibaba Cloud adalah platform lengkap yang dirancang untuk pengembangan model dasar dan pembuatan aplikasi. Platform ini memungkinkan pengembang dan profesional bisnis untuk terlibat dengan cepat dalam membuat dan menerapkan aplikasi model dasar. Pembaca didorong untuk menjelajahi berbagai opsi Model studio.
Untuk blog ini, kita hanya perlu mendapatkan kunci API dari model studio yang akan digunakan dalam program Python kita untuk berinteraksi dengan model Qwen-VL-Plus. Untuk mendapatkan kunci API, ikuti langkah-langkah yang ditunjukkan dalam gambar berikut:
Untuk demo ini, kita akan menggunakan VS Code untuk menulis skrip Python guna mengekstrak informasi, seperti nama buku, penulis, dan nama penerbit, dari halaman judul buku yang tersimpan di bucket OSS bernama "bookcatalog" di bawah direktori "um".
Menyiapkan Lingkungan
Melakukan Panggilan API
Pustaka Python.
pip install dashscope python-dotenv
Menyimpan Hasil dalam Format CSV
Untuk memverifikasi hasilnya, saya menunjukkan gambar sebenarnya buku5 yang tersimpan di bucket OSS:
Output Qwen-VL-Plus untuk gambar ini adalah: "Seni Berperang, Sun Tzu, Buku Antik" yang sempurna.
Kesimpulannya, menggabungkan OSS Alibaba Cloud dengan model Qwen-VL-Plus dari Model Studio memungkinkan solusi otomatis yang disederhanakan untuk membuat katalog koleksi buka langsung dari gambar sampul. Dengan menyimpan gambar di OSS dan memanfaatkan AI untuk mengekstrak perincian penting buku, kita dapat menghasilkan katalog yang teratur dan terstruktur dalam format CSV secara efisien. Pendekatan ini tidak hanya menghemat waktu dan mengurangi entri data manual, tetapi juga menawarkan potensi yang dapat diskalakan untuk koleksi yang lebih besar. Karena layanan AI dan cloud terus berkembang, integrasi tersebut akan menjadi semakin berharga bagi organisasi dan individu yang mencari solusi cerdas untuk mengelola dan mengatur sejumlah besar informasi visual.
Artikel ini diterjemahkan dari bahasa Inggris. Lihat artikel asli di sini.
การสร้างแค็ตตาล็อกจากภาพหนังสือโดยใช้ Alibaba Cloud OSS และ Model Studio
93 posts | 3 followers
FollowRegional Content Hub - July 15, 2024
Alibaba Cloud Indonesia - September 4, 2020
Alibaba Cloud Indonesia - March 24, 2023
Regional Content Hub - April 1, 2024
Regional Content Hub - November 25, 2024
Regional Content Hub - July 22, 2024
93 posts | 3 followers
FollowA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreTop-performance foundation models from Alibaba Cloud
Learn MoreProvides scalable, distributed, and high-performance block storage and object storage services in a software-defined manner.
Learn MoreAn encrypted and secure cloud storage service which stores, processes and accesses massive amounts of data from anywhere in the world
Learn MoreMore Posts by Regional Content Hub