Do Jawad viết
Trong thời đại số ngày nay, việc quản lý và trích xuất thông tin hiệu quả từ nội dung hình ảnh là điều cần thiết, đặc biệt là đối với thư viện, hiệu sách và bộ sưu tập cá nhân. Việc tận dụng công nghệ lưu trữ đám mây và AI có thể giúp đơn giản hóa đáng kể quy trình này.
Trong blog này, chúng tôi sẽ hướng dẫn bạn cách tạo hệ thống danh mục đọc hình ảnh bìa sách được lưu trữ trong bộ chứa Alibaba Cloud OSS và tạo tập tin CSV (danh mục) với các thông tin chi tiết như tên sách, tác giả và nhà xuất bản. Phương pháp này kết hợp sức mạnh của Alibaba Cloud OSS để lưu trữ theo cách có thể tăng dung lượng và mô hình Qwen-VL-Plus trong Model Studio để trích xuất thông tin thông minh từ hình ảnh. Để biết cách thức, vui lòng xem video này.
Alibaba Cloud OSS là gì?
Tạo bộ chứa OSS
Tải hình ảnh lên
Alibaba Cloud Model Studio là nền tảng toàn diện được thiết kế để phát triển mô hình nền tảng và xây dựng ứng dụng. Studio này giúp cả nhà phát triển và chuyên gia kinh doanh nhanh chóng tham gia vào việc tạo và triển khai các ứng dụng mô hình nền tảng. Người đọc nên khám phá nhiều lựa chọn khác nhau của Model Studio.
Trong blog này, chúng ta chỉ cần lấy khóa API từ Model Studio mà chúng ta sẽ sử dụng trong chương trình Python để tương tác với mô hình Qwen-VL-Plus. Để lấy khóa API, hãy làm theo các bước như trong hình sau đây:
Đối với bản minh họa này, chúng ta sẽ sử dụng VS Code để viết tập lệnh Python nhằm trích xuất thông tin như tên sách, tên tác giả và nhà xuất bản từ các trang tiêu đề sách được lưu trữ trong bộ chứa OSS có tên "bookcatalog" trong thư mục "um".
Thiết lập môi trường
Thực hiện lệnh gọi API
Thư viện Python.
pip install dashscope python-dotenv
Lưu trữ kết quả ở định dạng CSV
Để xác minh kết quả, tôi sẽ hiển thị hình ảnh thực tế của book5 được lưu trữ trong bộ chứa OSS:
Kết quả của Qwen-VL-Plus cho hình ảnh này là: "Binh pháp Tôn Tử, Sách cổ", rất hoàn hảo.
Tóm lại, việc kết hợp Alibaba Cloud OSS với mô hình Qwen-VL-Plus của Model Studio sẽ tạo ra giải pháp tự động, tinh giản giúp lập danh mục bộ sưu tập sách trực tiếp từ hình ảnh bìa. Bằng cách lưu trữ hình ảnh trong OSS và tận dụng AI để trích xuất thông tin cần thiết của sách, chúng ta có thể tạo các danh mục có cấu trúc và được sắp xếp hợp lý ở định dạng CSV một cách hiệu quả. Phương pháp này không chỉ tiết kiệm thời gian và giảm việc nhập dữ liệu thủ công, mà còn có tiềm năng mở rộng cho các bộ sưu tập lớn hơn. Khi AI và các dịch vụ đám mây tiếp tục phát triển, những hoạt động tích hợp như vậy sẽ ngày càng có giá trị đối với các tổ chức và cá nhân đang tìm các giải pháp thông minh để quản lý và sắp xếp lượng thông tin hình ảnh khổng lồ.
Bài viết này được dịch từ tiếng Anh. Xem bài viết gốc tại đây.
Membuat Katalog dari Gambar Buku Menggunakan OSS dan Model Studio Alibaba Cloud
Xây dựng chatbot tùy chỉnh với Web-Scraping và Alibaba Cloud Model Studio
95 posts | 3 followers
FollowNguyen Phuc Khang - July 13, 2024
Regional Content Hub - October 21, 2024
Regional Content Hub - January 6, 2025
Regional Content Hub - August 29, 2024
Regional Content Hub - May 13, 2024
Nong The Hoang - March 4, 2024
95 posts | 3 followers
FollowA one-stop generative AI platform to build intelligent applications that understand your business, based on Qwen model series such as Qwen-Max and other popular models
Learn MoreTop-performance foundation models from Alibaba Cloud
Learn MoreProvides scalable, distributed, and high-performance block storage and object storage services in a software-defined manner.
Learn MoreAn encrypted and secure cloud storage service which stores, processes and accesses massive amounts of data from anywhere in the world
Learn MoreMore Posts by Regional Content Hub