全部產品
Search
文件中心

Elastic Container Instance:使用資料緩衝加速部署Stable Diffusion應用

更新時間:Jul 06, 2024

本文以部署HuggingFace上的Stable Diffusion為例,示範如何使用資料緩衝。通過資料緩衝提前拉取Stable Diffusion相關模型資料,然後在建立Stable Diffusion應用執行個體時直接掛載模型資料,可以免去在執行個體中拉模數型資料的等待時間,加速Stable Diffusion應用部署。

背景資訊

Stable Diffusion是一個可以根據文字描述產生和修改映像的模型。Stable Diffusion分為文字理解和圖片產生兩個部分。文字理解部分使用CLIP模型對文本進行Encoding,圖片產生採用Diffusion模型。

重要
  • 阿里雲不對第三方模型的合法性、安全性、準確性進行任何保證,阿里雲不對由此引發的任何損害承擔責任。

  • 您應自覺遵守第三方模型的使用者協議、使用規範和相關法律法規,並就使用第三方模型的合法性、合規性自行承擔相關責任。

前提條件

您使用的VPC已綁定公網NAT Gateway,並配置SNAT條目允許該VPC或下屬交換器的資源可以訪問公網。

說明

如果VPC沒有綁定公網NAT Gateway,您需要在建立資料緩衝和部署應用時綁定EIP,以便可以拉取公網資料。

準備運行環境

部署Stable Diffusion應用需要準備好包含Stable Diffusion運行所需環境的容器鏡像,環境需求包括CUDA、Diffusers庫,以及其他的基礎依賴等。ECI已經準備好了能運行大多數模型的穩定環境的容器鏡像。如果您的應用沒有特殊依賴,可以直接使用。

  • 啟動HTTP服務的鏡像

    • GPU版:registry.cn-hangzhou.aliyuncs.com/eci_open/ubuntu:cuda11.7.1-cudnn8-ubuntu20.04

    • CPU版:registry.cn-hangzhou.aliyuncs.com/eci_open/ubuntu:hf-ubuntu20.04

    鏡像相關資訊參考如下:

    展開查看構建鏡像的完整Dockerfile

    以下Dockerfile可以構建一個基於Ubuntu和Python的開發環境,並預先安裝一些常用依賴。在啟動容器後,可以使用命令python3 http-server.py啟動一個HTTP服務。

    FROM nvidia/cuda:11.7.1-cudnn8-runtime-ubuntu20.04
    LABEL maintainer="Alibaba Cloud Serverless Container"
    
    ENV DEBIAN_FRONTEND=noninteractive
    
    RUN apt update && \
        apt install -y bash \
                       vim \
                       build-essential \
                       git \
                       git-lfs \
                       curl \
                       ca-certificates \
                       libsndfile1-dev \
                       libgl1 \
                       python3.8 \
                       python3-pip \
                       python3.8-venv && \
        rm -rf /var/lib/apt/lists
    
    # make sure to use venv
    RUN python3 -m venv /opt/venv
    ENV PATH="/opt/venv/bin:$PATH"
    RUN mkdir -p /workspace/pic/
    WORKDIR /workspace
    COPY http-server.py http-server.py
    
    # pre-install the heavy dependencies (these can later be overridden by the deps from setup.py)
    RUN python3 -m pip install --no-cache-dir --upgrade pip && \
        python3 -m pip install --no-cache-dir \
            torch \
            torchvision \
            torchaudio \
            invisible_watermark && \
        python3 -m pip install --no-cache-dir \
            accelerate \
            datasets \
            hf-doc-builder \
            huggingface-hub \
            Jinja2 \
            librosa \
            numpy \
            scipy \
            tensorboard \
            transformers \
            omegaconf \
            pytorch-lightning \
            xformers \
            safetensors \
            diffusers
            
    
    CMD ["/bin/bash"]

    展開查看鏡像中用到的HTTP服務指令碼

    http-server.py指令碼是一個簡單的HTTP服務,用於接收輸入的文本,產生對應的圖片,並返回圖片路徑。

    import os
    import hashlib
    import torch
    from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler
    from http.server import BaseHTTPRequestHandler
    from http.server import HTTPServer
    from urllib.parse import urlparse, parse_qs
    
    MODEL_DIR_NEV = "MODEL_DIR"
    APP_PORT_ENV = "APP_PORT"
    
    
    def text2image(input):
        model_id = os.getenv(MODEL_DIR_NEV, default="/data/model/")
        pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
    
        pipe.scheduler = DPMSolverMultistepScheduler.from_config(pipe.scheduler.config)
        pipe = pipe.to("cuda")
    
        image = pipe(input).images[0]
        name = "/workspace/pic/" + hashlib.md5(input.encode('utf8')).hexdigest() + ".png"
        image.save(name)
        return name
    
    
    class GetHandler(BaseHTTPRequestHandler):
    
        def do_GET(self):
            query = parse_qs(urlparse(self.path).query)
            # 擷取參數值
            input = query.get('input')[0]
            print("get user input:%s, try generate image" % input)
            picName = text2image(input)
            # 構造響應
            self.send_response(200)
            self.send_header('Content-type', 'text/html')
            self.end_headers()
            self.wfile.write(bytes("<html><head><title>Stable Diffusion</title></head>", "utf-8"))
            self.wfile.write(bytes("<body><p>Success generate image:%s</p>" % picName, "utf-8"))
            self.wfile.write(bytes("</body></html>", "utf-8"))
    
    
    if __name__ == '__main__':
        server = HTTPServer(('', int(os.getenv(APP_PORT_ENV, default="8888"))), GetHandler)
        server.serve_forever()
        print('Starting server')
    
  • 支援WebUI的鏡像

    鏡像地址:registry.cn-hangzhou.aliyuncs.com/eci_open/stable-diffusion:1.0.0

    說明

    該鏡像對於Stable Diffusion模型是通用的,只需將建立好的模型資料緩衝掛載到/stable-diffusion-webui/models/Stable-diffusion/目錄即可使用不同的模型。

操作步驟

使用啟動HTTP服務的鏡像

建立資料緩衝

  1. 訪問HuggingFace,擷取模型ID。

    本樣本使用stabilityai/stable-diffusion-2-1模型。在HuggingFace找到目標模型後,在模型詳情頁面頂部可以複製模型ID。

  2. 建立資料緩衝。

    調用CreateDataCache介面建立資料緩衝所採用的參數樣本如下,表示從HuggingFace拉取指定模型資料,儲存到名為test的Bucket的/model/stable-diffusion/目錄。資料緩衝名為stable-diffusion,保留時間長度為1天。

    重要

    如果您通過SDK建立資料緩衝,DataSource.Options中的各個參數前無需添加參數名的長度,例如#10#repoSource直接寫成repoSource#6#repoId直接寫成repoId即可。

    {
      "RegionId": "cn-beijing",
      "SecurityGroupId": "sg-2ze63v3jtm8e6syi****",
      "VSwitchId": "vsw-2ze94pjtfuj9vaymf****",
      "Bucket": "test",
      "Path": "/model/stable-diffusion/",
      "Name": "stable-diffusion",
      "DataSource": {
        "Type": "URL",
        "Options": {
          "#10#repoSource": "HuggingFace/Model",
          "#6#repoId": "stabilityai/stable-diffusion-2-1"
        }
      },
      "RetentionDays": 1
    }
  3. 查詢資料緩衝狀態。

    根據返回的資料緩衝ID調用DescribeDataCaches介面查詢資料緩衝資訊,當資料緩衝的狀態(DataCaches.Status)為Available時,表示可以使用該資料緩衝。

部署Stable Diffusion應用

  1. 使用資料緩衝建立ECI執行個體,部署Stable Diffusion應用。

    調用CreateContainerGroup介面建立ECI執行個體所採用的參數樣本如下,該ECI執行個體使用GPU規格,並掛載了Stable Diffusion v2-1模型資料。執行個體內容器使用GPU版鏡像,容器啟動後會運行python3 http-server.py,啟動一個HTTP服務。

    {
      "RegionId": "cn-beijing",
      "SecurityGroupId": "sg-2ze63v3jtm8e6syi****",
      "VSwitchId": "vsw-2ze94pjtfuj9vaymf****",
      "ContainerGroupName": "stable-diffusion",
      "InstanceType": "ecs.gn6i-c16g1.4xlarge",
      "DataCacheBucket": "test",
      "Container": [
        {
          "Arg": [
            "python3 http-server.py"
          ],
          "VolumeMount": [
            {
              "MountPath": "/data/model/",
              "Name": "model"
            }
          ],
          "Command": [
            "/bin/sh",
            "-c"
          ],
          "Gpu": 1,
          "Name": "stable-diffusion",
          "Image": "registry.cn-hangzhou.aliyuncs.com/eci_open/ubuntu:cuda11.7.1-cudnn8-ubuntu20.04"
        }
      ],
      "Volume": [
        {
          "Type": "HostPathVolume",
          "HostPathVolume.Path": "/model/stable-diffusion/",
          "Name": "model"
        }
      ]
    }
  2. 確認應用部署狀態。

    根據返回的執行個體ID調用DescribeContainerGroupStatus查詢執行個體和容器狀態。當執行個體狀態(Status)和容器狀態(ContainerStatuses.State)為Running,表示執行個體已經建立成功,容器正在運行。

  3. 對外開放應用。

    在ECI執行個體所屬VPC已綁定NAT Gateway的前提下,您需要建立DNAT條目,使得ECI執行個體可以對外提供公網訪問服務。具體操作,請參見建立和管理DNAT條目

    說明

    如果VPC沒有綁定NAT Gateway,則需要您在建立ECI執行個體時為其綁定一個EIP,此時可以跳過本步驟。

    建立DNAT條目採用的配置項樣本如下:

    • 公網IP地址:選擇NAT Gateway綁定的EIP地址。

    • 私網IP地址:選擇部署了Stable Diffusion應用的ECI執行個體。

    • 連接埠設定:使用具體連接埠,公網連接埠配置為80,私網連接埠配置為8888,協議為TCP。

測試模型效果

  1. 傳入文本,測試是否可以產生圖片。

    1. 在ECI執行個體所屬安全性群組中添加入方向規則,開放應用對外連接埠(本文以80連接埠為例)。

    2. 開啟瀏覽器,訪問Stable Diffusion應用,並傳入文本描述。

      在配置了DNAT的情況下,請輸入DNAT條目中配置的公網IP地址和公網連接埠,以及文本描述,例如47.94.XX.XX:80?input=xxx。其中,input=xxx表示要傳入的文本描述,Stable Diffusion應用會基於該文本描述產生圖片,並將圖片儲存到容器的/workspace/pic目錄下。樣本如下:

      StableDiffusion-api.png

  2. 查看產生的圖片。

    1. 在容器內部啟動一個新的HTTP服務,用於查看圖片。

      串連容器後執行以下命令:

      python3 -m http.server 7777 --directory /workspace/pic/ &
    2. 在ECI執行個體所屬安全性群組中添加入方向規則,開放用於查看圖片的連接埠(本文以70連接埠為例)。

    3. 建立一條新的DNAT條目,以便外部可以訪問新的HTTP服務。

      新的DNAT條目採用的連接埠樣本為:公網連接埠配置為70,私網連接埠配置為7777,協議為TCP。

    4. 查看產生的圖片。

      輸入新的DNAT條目中配置的公網IP地址和公網連接埠,例如47.94.XX.XX:70

      樣本如下:

      StableDiffusion-api-1.png

使用支援WebUI的鏡像

建立資料緩衝

  1. 訪問HuggingFace,擷取模型ID。

    本樣本使用hanafuusen2001/BeautyProMix模型。在HuggingFace找到目標模型後,在模型詳情頁面頂部可以複製模型ID。

  2. 建立資料緩衝。

    調用CreateDataCache介面建立資料緩衝所採用的參數樣本如下,表示從HuggingFace拉取指定模型資料,儲存到名為test的Bucket的/model/BeautyProMix/目錄。資料緩衝名為beautypromix,保留時間長度為1天。

    {
      "RegionId": "cn-beijing",
      "SecurityGroupId": "sg-2ze63v3jtm8e6syi****",
      "VSwitchId": "vsw-2ze94pjtfuj9vaymf****",
      "Bucket": "test",
      "Path": "/model/BeautyProMix/",
      "Name": "beautypromix",
      "DataSource": {
        "Type": "URL",
        "Options": {
          "#10#repoSource": "HuggingFace/Model",
          "#6#repoId": "hanafuusen2001/BeautyProMix"
        }
      },
      "RetentionDays": 1
    }
  3. 查詢資料緩衝狀態。

    根據返回的資料緩衝ID調用DescribeDataCaches介面查詢資料緩衝資訊,當資料緩衝的狀態(DataCaches.Status)為Available時,表示可以使用該資料緩衝。

部署Stable Diffusion應用

  1. 使用資料緩衝建立ECI執行個體,部署Stable Diffusion應用。

    調用CreateContainerGroup介面建立ECI執行個體所採用的參數樣本如下,該ECI執行個體使用GPU規格,並掛載了BeautyProMix模型資料。執行個體內的容器使用GPU版鏡像,容器啟動後會運行python3 launch.py --listen --skip-torch-cuda-test --port 8888 --no-half,啟動一個WebUI。

    {
      "RegionId": "cn-beijing",
      "SecurityGroupId": "sg-2ze63v3jtm8e6syi****",
      "VSwitchId": "vsw-2ze94pjtfuj9vaymf****",
      "ContainerGroupName": "stable-diffusion",
      "InstanceType": "ecs.gn6i-c16g1.4xlarge",
      "DataCacheBucket": "test",
      "Container": [
        {
          "Arg": [
            "python3 launch.py --listen --skip-torch-cuda-test --port 8888 --no-half"
          ],
          "VolumeMount": [
            {
              "MountPath": "/stable-diffusion-webui/models/Stable-diffusion/",
              "Name": "model"
            }
          ],
          "Command": [
            "/bin/sh",
            "-c"
          ],
          "Gpu": 1,
          "Name": "stable-diffusion",
          "Image": "registry.cn-hangzhou.aliyuncs.com/eci_open/stable-diffusion:1.0.0"
        }
      ],
      "Volume": [
        {
          "Type": "HostPathVolume",
          "HostPathVolume.Path": "/model/BeautyProMix/",
          "Name": "model"
        }
      ]
    }
  2. 確認應用部署狀態。

    根據返回的執行個體ID調用DescribeContainerGroupStatus查詢執行個體和容器狀態。當執行個體狀態(Status)和容器狀態(ContainerStatuses.State)為Running,表示執行個體已經建立成功,容器正在運行。

  3. 對外開放應用。

    在ECI執行個體所屬VPC已綁定NAT Gateway的前提下,您需要建立DNAT條目,使得ECI執行個體可以對外提供公網訪問服務。具體操作,請參見建立和管理DNAT條目

    說明

    如果VPC沒有綁定NAT Gateway,則需要您在建立ECI執行個體時為其綁定一個EIP,此時可以跳過本步驟。

    建立DNAT條目採用的配置項樣本如下:

    • 公網IP地址:選擇NAT Gateway綁定的EIP地址。

    • 私網IP地址:選擇部署了Stable Diffusion應用的ECI執行個體。

    • 連接埠設定:使用具體連接埠,公網連接埠配置為80,私網連接埠配置為8888,協議為TCP。

測試模型效果

  1. 在ECI執行個體所屬安全性群組中添加入方向規則,開放應用對外連接埠。

  2. 開啟瀏覽器,訪問Stable Diffusion應用。

    在配置了DNAT的情況下,請輸入DNAT條目中配置的公網IP地址和公網連接埠,例如47.94.XX.XX:80

    說明

    如果ECI執行個體單獨綁定了EIP,請輸入EIP地址和容器開放的連接埠,例如47.94.XX.XX:8888

  3. 輸入文本描述,測試圖片產生。

    樣本如下:

    webui-api.png