×
Community Blog Tongyi Wanxiang - Sebuah Alibaba Cloud SaaS untuk Pembuatan Konten Multimodal

Tongyi Wanxiang - Sebuah Alibaba Cloud SaaS untuk Pembuatan Konten Multimodal

Dalam blog ini kita akan mencermati kemampuan Tongyi Wanxiang, SaaS multimodal untuk AI Generatif.

Alibaba Cloud memiliki berbagai produk SaaS di bawah ekosistem Tongyi. Berbagai produk SaaS dari Tongyi tersebut adalah:

  • Tongyi Qianwen - LLM Qwen untuk membuat hasil teks berdasarkan perintah teks dan model Qwen VL untuk direspons berdasarkan gambar.
  • Tongyi Wanxiang - Membuat gambar berdasarkan perintah teks, mengedit latar depan dan latar belakang gambar dasar menggunakan gambar referensi dan perintah serta pembuatan video berdasarkan perintah.
  • Tongyi Lingma - Plugin pembuatan kode co-pilot yang tersedia untuk IDE seperti VS Code dan Jet Beans.
  • Tongyi Tingwu - Penerjemahan suara ke teks dan transliterasi dari audio langsung atau audio tersimpan.

Dalam blog ini kita akan mencermati kemampuan Tongyi Wanxiang, SaaS multimodal untuk AI Generatif. Alibaba Cloud memiliki model studio yang berfungsi dengan fungsionalitas Model sebagai Layanan (MaaS). Model Ini memiliki model bahasa visi Qwen VL. Kita akan menggunakan ini terutama untuk skenario berikut:

Azeez adalah arsitek yang berkantor di Dubai dan mengkhususkan diri dalam merancang gedung pencakar langit dalam proyek yang baru ditugaskan. Dia berselancar di internet dan menemukan gambar referensi untuk proyeknya. Dia tidak dapat menggunakan gambar tersebut karena mungkin memiliki hak cipta dan tidak 100 persen memenuhi gagasannya. Jadi dia ingin membuat gambar yang mirip dengan yang diunduh dari internet tersebut. Dia tidak memiliki latar belakang teknis untuk membuat perintah yang bagus tetapi memiliki pengetahuan tentang penggunaan Model Studio Alibaba Cloud. Prosedur tentang cara dia mengubah gambar ini menjadi gambar yang dihasilkan AI tanpa hak cipta dan cukup meyakinkan untuk produktivitas proyeknya.

Masuk ke konsol Model Studio.

1

Klik Use Now (Gunakan Sekarang).

2

Klik Playground (Taman Bermain).

3

Telusuri model dan pilih Qwen-VL-Plus atau Qwen-VL-Max.

4

Klik ikon gambar untuk memilih gambar yang dia unduh.

5
Masukkan perintah seperti Create a prompt to generate a picture as same as this image. Klik tombol di kanan bawah untuk masuk.

6

Salin perintah tersebut dan buka portal Tongyi Wanxiang SaaS.

7

Masukkan perintah yang disalin dari Qwen VL Max dan klik "Generate a painting" (Buat lukisan).

8

Arsitek tersebut memilih gambar kedua yang dihasilkan karena terlihat dekat dengan imajinasinya. Klik gambar tersebut.

9

Klik untuk mengunduh gambar tersebut. Sekarang gambar tersebut membutuhkan rekaman video dinamis. Buka halaman pembuatan video. Fitur pembuatan video ini dirilis dalam konferensi Apsara terbaru 2024.

10

Klik figure video.

11

Klik area yang disorot dan pilih gambar lalu klik selesai.

12

Masukkan perintah untuk mengapungkan sesuai dengan imajinasi. Klik Generate Video (Buat Video).

13

Dibutuhkan waktu untuk membuat video tersebut.

14

Aplikasi Tongyi tersedia untuk digunakan di iOS dan Android.

15

Unduh video dan diputar sebagai berikut.

Untuk petunjuk lainnya, kami memiliki beberapa video yang dibuat dan dibagikan sebagai referensi.

Buat video yang menampilkan pria ini bermain badminton mengenakan pakaian cyborg.

Seorang gadis India yang cantik mengenakan pakaian tradisional berwarna biru sedang memintal benang untuk membuat tikar sutra berwarna merah dengan 9:16.

Seorang gadis India yang cantik mengenakan pakaian tradisional berwarna biru sedang memintal benang untuk membuat tikar sutra berwarna merah.


Artikel ini diterjemahkan dari bahasa Inggris. Lihat artikel aslinya di sini.

0 0 0
Share on

Regional Content Hub

86 posts | 3 followers

You may also like

Comments

Regional Content Hub

86 posts | 3 followers

Related Products