×
Community Blog Tongyi Wanxiang - マルチモーダルコンテンツ生成のための Alibaba Cloud SaaS

Tongyi Wanxiang - マルチモーダルコンテンツ生成のための Alibaba Cloud SaaS

このブログでは、生成 AI 用のマルチモーダル SaaS である Tongyi Wanxiang の機能について説明します。

Alibaba Cloud の Tongyi エコシステムには、さまざまな SaaS プロダクトがあります。Tongyi のSaaS プロダクトは以下のとおりです。

  • Tongyi Qianwen - テキストプロンプトに基づいてテキスト結果を生成する Qwen LLM と、画像に基づいて応答する Qwen VL モデル。
  • Tongyi Wanxiang - テキストプロンプトに基づいて画像を生成し、参照画像とプロンプトを使用してベース画像の前景と背景を編集し、プロンプトに基づいてビデオを生成します。
  • Tongyi Lingma - VS Code や Jet Beans などの IDE で利用できる co-pilot コード生成プラグイン。
  • Tongyi Tingwu - ライブオーディオまたは保存されたオーディオからのテキスト翻訳および文字起こし。

このブログでは、生成 AI 向けのマルチモーダル SaaS である Tongyi Wanxiang の機能について説明します。Alibaba Cloud では、MaaS (model as a Service) の機能と連携する モデルスタジオ を用意しています。Qwen VL の視覚言語モデルを備えています。主に以下のようなシナリオで使用されます。

Azeez はドバイを拠点とする建築家であり、新しく割り当てられたプロジェクトで超高層ビルの設計を専門としています。彼はインターネットを閲覧し、プロジェクトの参照画像を見つけました。著作権侵害を主張される可能性があるため、彼はその画像をそのまま使用することはできませんが、画像は彼の考えと100パーセント一致するものではありませんでした。そこで、彼はインターネットからダウンロードしたものと似た画像を生成したいと考えました。彼には、優れたプロンプトを作成する技術的なバックグラウンドはありませんでしたが、Alibaba Cloud Model Studio の使用に関する知識は持っていました。以下に、彼がプロジェクトの生産性を十分に満足させるために、この画像を著作権で保護されていない AI 生成画像に変換し手順を説明します。

Model Studio コンソールに入ります。

1

[Use Now] をクリックします。

2

[Playground] をクリックします。

3

モデルを参照し、[Qwen-VL-Plus] または [Qwen-VL-Max] を選択します。

4

画像アイコンをクリックして、ダウンロードした画像を選択します。

5
次のようにプロンプトを入力します:「Create a prompt to generate a picture as same as this image.」右下のボタンをクリックします。

6

プロンプトをコピーして、Tongyi Wanxiang SaaS ポータルを開きます。

7

Qwen VL Max からコピーしたプロンプトを入力し、[Generate a painting] をクリックします。

8

自分のイメージに近い、2 番目の画像を選択します。この画像をクリックします。

9

クリックすると画像がダウンロードされます。次に、画像にダイナミックなビデオを追加します。ビデオ生成ページに移動します。このビデオ生成機能は、最近開催された Apsara Conreference 2024 でリリースされたものです。

10

[Figure video] をクリックします。

11

強調表示された領域をクリックして画像を選択し、[Finish] をクリックします。

12

思いつくプロンプトを入力します。[Generate Video] をクリックします。

13

ビデオの生成にはしばらく時間がかかります。

14

iOS と Android 用の Tongyi アプリが使用できます。

15

ビデオをダウンロードします。以下のように再生されます。

他のプロンプトで作成されたビデオを参考のためにご紹介します。

「Generate a video where this man is playing badminton wearing a cyborg outfit.」

「A beautiful Indian girl wearing a blue traditional attire spinning a yarn to make silk mat which is red in colour with 9:16.」

「A beautiful Indian girl wearing a blue traditional attire spinning a yarn to make silk mat which is red in colour.」


この記事は英語から翻訳されました。元の記事は こちらをご参照ください。

0 0 0
Share on

Regional Content Hub

86 posts | 3 followers

You may also like

Comments