全部產品
Search
文件中心

Platform For AI:服務部署:控制台

更新時間:Oct 25, 2024

EAS支援將從開源社區下載的模型或您自己訓練獲得的模型部署為推理服務或AI-Web應用。針對不同方式擷取的訓練模型,EAS支援不同的部署方式。此外,EAS還提供了一系列針對特定情境的部署方式,您可以通過控制台快速將其部署為線上服務。本文介紹如何使用控制台方式部署及管理服務。

前提條件

已獲得訓練好的模型。

背景資訊

您可以通過控制台部署及管理EAS

  • 控制台上傳部署

    支援自訂模型部署情境化模型部署兩種方式:

    • 自訂模型部署:自訂模型部署提供更靈活的部署方式,您可以通過鏡像、模型、processor等方式快速進行AI-Web應用或推理服務的部署。

    • 情境化模型部署:EAS提供了多種針對特定情境的部署解決方案,包括AI繪畫-SDWebUI部署、LLM大語言模型、大模型RAG對話系統、AI視頻產生-ComfyUI部署、ModelScope模型部署、HuggingFace模型部署、Triton部署和TFServing部署。對於這些不同的部署情境,均提供了簡易的部署方法。

  • 管理EAS

    EAS支援通過控制台方式管理已部署的模型服務,包括:查看服務詳情、更新服務資源配置、更新服務版本、擴縮容等操作。

控制台上傳部署

在模型線上服務頁面,您可直接將訓練完成的模型或開源社區模型部署為線上服務。

步驟一:進入模型線上服務頁面

  1. 登入PAI控制台

  2. 在左側導覽列單擊工作空間列表,在工作空間列表頁面中單擊待操作的工作空間名稱,進入對應的工作空間。

  3. 在工作空間頁面的左側導覽列選擇模型部署 > 模型線上服務(EAS),進入模型線上服務(EAS)頁面。

步驟二:選擇部署方式

  1. 推理服務頁簽,單擊部署服務

  2. 部署服務頁面,選擇並單擊相應的部署方式。

    部署方式

    描述

    自訂模型部署

    自訂部署

    提供更靈活的部署方式。支援通過Processor的形式,或鏡像、模型、代碼、運行命令和三方庫的方式,將您自己的模型部署為線上服務或AI-Web應用。具體的參數配置說明,請參見自訂部署方式參數配置說明

    JSON獨立部署

    根據輸入的JSON檔案內容來完成模型部署。具體的參數配置說明,請參見JSON獨立部署方式參數配置說明

    情境化模型部署

    說明

    關於各個情境的參數配置說明,請參見情境化部署方式參數配置說明

    AI繪畫-SDWebUI部署

    一鍵部署基於開源SDWebUI繪畫的AIGC服務,提供Web應用和API調用兩種部署方式,通過使用者與計算資源分離實現企業級應用。

    LLM大語言模型部署

    一鍵部署支援WebUI和API調用的LLM應用,您可以利用LangChain框架組成企業知識庫,以實現智能問答和自動化功能。通過Blade內建推理加速,實現簡單的部署方式及較高性價比的推理方案。

    大模型RAG對話系統部署

    一鍵部署整合了大語言模型(LLM)和檢索增強產生(RAG)技術的對話系統服務。適用於問答、摘要產生和依賴外部知識的自然語言處理任務。

    AI視頻產生-ComfyUI部署

    一鍵部署基於ComfyUI和Stable Video Diffusion模型的AI視頻產生服務,協助您完成社交平台短視頻內容產生、動畫製作等任務。

    ModelScope模型部署

    一鍵部署ModelScope開源模型,快速啟動模型服務。

    HuggingFace模型部署

    一鍵部署HuggingFace開源模型,快速啟動模型服務。

    Triton部署

    利用基於Trition Server的推理服務引擎,將TensorRT、TensorFlow、PyTorch或ONNX等多種AI架構的模型一鍵部署為線上推理服務。

    TFServing部署

    利用基於TensorFlow Serving的推理服務引擎,將Tensorflow標準的SavedModel格式的模型一鍵部署為線上推理服務。

步驟三:部署服務

根據您選擇的部署方式,請參考以下內容配置相應的參數。參數配置完成後,單擊部署。等待一段時間,當服務狀態變為運行中時,表明服務部署成功。

自訂部署方式參數配置說明

  1. 建立服務頁面的模型服務資訊地區,配置參數。

    • 服務名稱:根據介面提示,自訂服務名稱。

    • 部署方式:支援鏡像部署服務鏡像部署AI-Web應用模型+processor部署服務三種部署方式。

      說明

      在複雜的模型推理情境中,例如AIGC、視頻處理等情境,推理耗時比較長,需要開啟非同步服務開關,實現非同步推理服務,詳情請參見部署非同步推理服務。僅當部署方式選擇鏡像部署服務模型+processor部署服務時,支援開啟非同步服務。

      • 鏡像部署服務:如果您想通過鏡像、代碼及模型掛載的方式快速進行AI推理服務的部署,則選擇該部署方式。

      • 鏡像部署AI-Web應用:如果您想將服務部署為一個AI-Web應用,需要啟動一個WebServer,則選擇該方式進行部署。

      • 模型+processor部署服務:如果您想通過模型和Processor(包括預置Processor自訂Processor)進行推理服務的部署,則選擇該部署方式。

      鏡像/鏡像AI-Web部署

      部署方式選擇鏡像部署服務鏡像部署AI-Web應用時,參數配置說明如下表所示:

      參數

      描述

      鏡像選擇

      支援以下幾種配置方式:

      • PAI平台鏡像:由阿里雲PAI產品提供的多種官方鏡像。

      • 使用者自訂鏡像:選擇已建立的自訂鏡像。關於如何建立自訂鏡像,詳情請參見自訂鏡像

      • 鏡像地址:支援輸入用於部署模型服務的鏡像地址,例如registry.cn-shanghai.aliyuncs.com/xxx/image:tag。您可以使用PAI官方公開鏡像地址,也可以使用自訂鏡像地址。鏡像地址的擷取方式,詳情請參見自訂鏡像

        重要

        選擇的鏡像地址和部署的服務需要在同一個地區。

        如果您使用私人倉庫中的鏡像,則需要單擊輸入,輸入鏡像倉庫使用者名稱鏡像倉庫密碼

      填寫模型配置

      單擊填寫模型配置,來進行模型配置。支援通過以下三種方式配置模型檔案。

      • OSS掛載

        • 配置OSS源地址路徑,即選擇OSS Bucket路徑。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取OSS路徑中的檔案。

      • NAS掛載

        • NAS掛載點:選擇NAS檔案系統和掛載點,EAS服務通過掛載點來訪問NAS檔案系統。如何建立通用型NAS檔案系統,詳情請參見建立檔案系統

        • NAS源路徑:需要掛載的NAS中的源路徑,即NAS執行個體內部的檔案系統路徑。

        • 掛載路徑:掛載到服務執行個體中的目標路徑,用來讀取NAS路徑中的檔案。

      • PAI模型掛載

        • 根據模型名稱和模型版本選擇登入的模型。關於如何查看登入的模型,詳情請參見註冊及管理模型

        • 配置掛載路徑:掛載服務執行個體中的目標路徑,用來讀模數型檔案。

      填寫代碼配置

      單擊填寫代碼配置,進行代碼配置,支援使用以下幾種掛載方式,來讀取服務部署過程依賴的代碼資料。

      • OSS掛載

        • 配置OSS源地址路徑,即選擇OSS Bucket路徑。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取OSS路徑中的檔案。

      • NAS掛載

        • NAS掛載點:配置NAS掛載點地址,EAS服務通過掛載點來訪問NAS檔案系統。

        • NAS源路徑:需要掛載的NAS中的源路徑。

        • 掛載路徑:掛載服務執行個體中的目標路徑,用來讀取NAS路徑中的檔案。

      • Git掛載

        • Git地址:配置Git代碼地址。

        • 掛載路徑:掛載服務執行個體中的目標路徑,用來讀取Git代碼地址中的代碼檔案。

      • PAI資料集掛載

        • 選擇已建立的資料集,如果沒有資料集,您可以單擊建立資料集來建立一個新的資料集。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取PAI資料集。

      • PAI代碼掛載

        • 選擇已建立的代碼集,如果沒有代碼集,您可以單擊建立代碼配置來建立一個新的代碼集。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取PAI代碼集。

      填寫三方庫配置列表

      單擊填寫三方庫配置列表來配置三方庫。支援以下兩種方式配置第三方庫。

      • 三方庫列表:直接在下方文字框中輸入三方庫。

      • requirements.txt檔案路徑:將第三方庫寫入requirements.txt檔案中,在下方文字框中指定該requirements.txt檔案的路徑。

      填寫環境變數

      單擊填寫環境變數來配置環境變數。

      組態變數名和變數值:

      • 變數名:鏡像執行時的環境變數名稱。

      • 變數值:鏡像執行時的環境變數取值。

      運行命令

      鏡像的啟動命令,例如:python /run.py

      同時您需要輸入連接埠號碼,即鏡像啟動後監聽的本地HTTP連接埠。

      重要

      由於EAS引擎監聽固定的8080和9090連接埠,因此連接埠需要避開8080和9090連接埠。

      模型+processor部署

      部署方式選擇模型+processor部署服務時,參數配置如下表所示:

      參數

      描述

      模型檔案

      您可以通過以下任何一種方式配置模型檔案:

      • OSS掛載

        選擇模型檔案所在的OSS路徑。

      • 上傳資料

        1. 選擇當前地區下的OSS路徑。

        2. 單擊查看本地檔案拖拽上傳檔案,並根據提示上傳本地模型檔案。

      • 公網下載地址

        單擊公網下載地址,並在下方文字框中輸入可以公開訪問的URL地址。

      • 模型選擇

        根據模型名稱和模型版本選擇登入的模型。關於如何查看登入的模型,詳情請參見註冊及管理模型

      Processor種類

      支援所有的預置官方Processor和自訂Processor,關於預置官方Processor的更多資訊,詳情請參見預置Processor使用說明

      模型類別

      Processor種類選擇EasyVision(CPU)EasyVision(GPU)EasyTransfer(CPU)EasyTransfer(GPU)EasyNLPEasyCV時,支援配置該參數。上述每個Processor種類對應的模型類別不同,請根據業務使用情境選擇。

      Processor語言

      Processor種類選擇自訂processor時,支援配置。

      支援選擇cppjavapython

      Processor包

      Processor種類選擇自訂processor時,支援配置。您可以通過以下任何一種方式配置Processor包:

      • OSS檔案匯入

        單擊OSS檔案匯入,並選擇檔案所在的OSS路徑。

      • 本地上傳

        1. 單擊本地上傳

        2. 選擇當前地區下的OSS Bucket路徑。

        3. 單擊查看本地檔案拖拽上傳檔案,並根據提示上傳已下載的Processor檔案。

          系統會將檔案上傳至當前地區的官方OSS路徑,並自動設定Processor包

          說明

          通過本地上傳的方式,可以使系統在模型部署時,快速載入Processor。

      • 公網下載地址

        單擊公網下載地址,並在下方文字框中輸入可以公開訪問的URL地址。

      Processor主檔案

      Processor種類選擇自訂processor時,支援配置。自訂Processor包的主檔案。

      填寫掛載配置

      單擊填寫掛載配置,進行掛載配置,支援以下幾種掛載方式。

      • OSS掛載

        • 配置OSS源地址路徑,即選擇OSS Bucket路徑。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取OSS路徑中的檔案。

      • NAS掛載

        • NAS掛載點:配置NAS掛載點地址,EAS服務通過掛載點來訪問NAS檔案系統。

        • NAS源路徑:需要掛載的NAS中的源路徑。

        • 掛載路徑:掛載服務執行個體中的目標路徑,用來讀取NAS路徑中的檔案。

      • PAI資料集掛載

        • 選擇已建立的資料集,如果沒有資料集,您可以單擊建立資料集來建立一個新的資料集。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取PAI資料集。

      • PAI代碼掛載

        • 選擇已建立的代碼集,如果沒有代碼集,您可以單擊建立代碼配置來建立一個新的代碼集。

        • 配置掛載路徑,即配置掛載服務執行個體中的目標路徑,用來讀取PAI代碼集。

      填寫環境變數

      單擊填寫環境變數來配置環境變數。

      組態變數名和變數值:

      • 變數名:鏡像執行時的環境變數名稱。

      • 變數值:鏡像執行時的環境變數取值。

  2. 建立服務資源部署資訊地區,配置參數。

    參數

    描述

    資源群組種類

    支援選擇公用資源群組或已購買(建立)的專屬資源群組。如何購買專屬資源群組,詳情請參見使用專屬資源群組

    說明

    建議在任務量相對較少、對任務時效性要求不高的情境下使用公用資源群組。

    GPU共用

    資源群組種類選擇專屬資源群組時,支援開啟GPU共用功能。具體配置方法,請參見進階配置:GPU共用

    說明

    當前GPU共用功能僅供白名單使用者受限申請使用,如果您希望使用GPU共用功能,請先提交工單,申請添加GPU共用功能使用白名單。

    執行個體數

    建議配置多個服務執行個體,以避免單點部署帶來的風險。

    資源群組種類選擇專屬資源群組時,您需要為每個服務執行個體配置CPU記憶體(MB)GPU參數。

    資源配置方法

    資源群組種類選擇公用資源群組時,支援配置該參數。支援以下兩種配置方式:

    • 一般資源配置

      支援選擇單個CPU或GPU執行個體規格。

    • 性價比資源配置

      支援配置多規格執行個體搶佔型執行個體

      • 搶佔型保留時間長度:您可以為搶佔型執行個體設定1小時保護期,即執行個體搶佔成功後,預設至少可以使用1小時。

      • 部署資源:支援同時配置常規型資源或搶佔型資源,並按照配置規格的先後順序作為優先順序排序來拉起資源,最多支援添加5個資源類型。如果您設定搶佔型資源,需要為該機器資源設定出價上限,用來自動競價搶佔資源。

    彈性資源集區

    資源群組種類選擇專屬資源群組時,支援配置該參數。

    您可以開啟開啟彈性資源集區開關並參考資源配置方法進行公用資源配置,為部署在專屬資源群組中的服務開啟彈性資源集區能力。

    彈性資源集區配置完成後,當服務擴容時遇到機器資源不足時,新擴出來的執行個體會自動啟動在已配置的隨用隨付的公用資源上,並以隨用隨付的方式來進行計費;在縮容時會優先縮減公用資源群組中的服務執行個體。更多詳細內容,請參見彈性資源集區

    系統硬碟配置

    資源群組種類選擇公用資源群組時,支援配置該參數。

    單擊系統硬碟配置,為EAS服務配置額外系統硬碟,單位為GB,取值範圍為0~2000 GB。EAS免費贈送30 GB系統硬碟,如果此處配置20 GB,則實際可用的儲存空間為:免費的30 GB+購買的20 GB=50 GB

    額外購買的系統硬碟按容量和使用時間長度計費,計費詳情請參見模型線上服務(EAS)計費說明

  3. 可選:專用網路配置地區,配置VPC交換器安全性群組名稱參數,為部署在公用資源群組中的EAS服務開通VPC高速直連。

    網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

  4. 可選:服務功能配置地區,配置參數。

    參數

    描述

    記憶體緩衝加速

    EAS通過將模型檔案快取到本地目錄中,來提高讀取資料的速度,減少延時。更多關於該功能的詳細介紹及配置方法,請參見進階配置:記憶體緩衝本地目錄

    設定服務響應逾時時間

    設定服務響應逾時時間長度,預設為15秒。

    共用記憶體配置

    設定共用記憶體大小,單位為GB。

    Job模式

    單擊Job模式,並開啟開關,您可以將推理服務部署成彈性Job服務。更多關於彈性Job服務的內容介紹,請參見彈性Job服務功能介紹

    儲存服務調用記錄

    支援將服務所有的請求和響應記錄持久化儲存到MaxCompute資料表或Log ServiceSLS中。開啟開關,並選擇儲存記錄方式

    • 巨量資料MaxCompute

      • MaxCompute專案:在下拉式清單中選擇已建立的專案。如果沒有可選的專案,您也可以單擊建立MaxCompute專案進行建立,詳情請參見通過MaxCompute控制台建立專案

      • MaxCompute資料表:配置資料表名稱,部署服務時,系統會自動在MaxCompute專案中建立資料表。

    • Log ServiceSLS

      • 選擇SLS Project:Log Service中的資源嵌入式管理單元,用於資源隔離和控制。選擇已建立的專案,如果沒有可選的專案,您可以單擊前往建立SLS Project進行建立,詳情請參見管理Project

      • logstore:日誌庫(Logstore)是Log Service中日誌資料的採集、儲存和查詢單元。配置logstore,部署服務時,系統會自動在SLS Project專案中建立logstore。

    專屬網關

    單擊專屬網關,並在下拉式清單中選擇已建立的專屬網關。通過配置專屬網關,不僅可以增強存取控制與安全性,還可以提升網路訪問服務的效率。如何建立專屬網關以及配置存取控制,詳情請參見進階配置:服務專屬網關

    健全狀態檢查

    開啟健全狀態檢查開關,為服務配置健全狀態檢查功能。更多關於該功能的詳細介紹及配置方法,請參見進階配置:健全狀態檢查

    LLM智能路由

    開啟開關,並選擇LLM智能路由。如果沒有可選的LLM智能路由,您可以單擊建立LLM智能路由進行建立,詳情請參見LLM智能路由:提升LLM推理系統整體效率

    LLM智能路由是一種特殊的EAS服務,可以與LLM推理服務綁定。當LLM推理服務有多個後端執行個體時,LLM智能路由能夠根據後端負載進行動態分發,保證後端執行個體處理的算力和顯存儘可能均勻,提升叢集資源使用水位。

  5. 對應配置編輯地區,顯示服務配置的相關資訊。您可以根據需要補充一些在介面不支援配置的配置項,詳情請參見建立服務

    image

JSON獨立部署方式參數配置說明

參照服務模型所有相關參數說明,準備用於部署服務的JSON檔案。在JSON獨立部署頁面,將JSON檔案內容填入JSON文本編輯框中,然後單擊部署image

情境化部署方式參數配置說明

以下是您所選部署情境的參數配置說明:

AI繪畫-SDWebUI部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

版本選擇

支援選擇以下三種版本:

  • 標準版

    適用於單機使用的常規測試和應用,支援WebUI出圖以及API調用。

  • API版

    適用於直接通過API進行業務整合,該版本會自動將服務切換為非同步服務

  • 叢集版WebUI

    適合團隊成員共同使用WebUI執行AI繪圖任務,確保每個使用者的模型和輸出路徑保持獨立,同時後端計算資源實現共用調度,大幅提升效能與成本效益。

  • Serverless版

    該版本服務的部署完全免費,費用僅基於產生映像所需的時間來計算,並且服務會根據您的請求量自動進行Auto Scaling。僅支援通過WebUI進行調用。

    說明

    目前,僅華東2(上海)和華東1(杭州)地區支援部署Serverless版服務。

模型配置

如果您想使用自行下載的開源模型、微調訓練獲得的模型,或者您需要儲存輸出資料到您自己的資料來源中、需要進行一些第三方的配置和外掛程式安裝等。可以單擊添加按鈕進行配置。支援以下兩種配置類型:

  • 按Object Storage Service(OSS):選擇OSS Bucket空檔案目錄。關於如何建立Bucket,請參見建立儲存空間;關於如何建立空目錄,請參見管理目錄

  • 按檔案儲存體(NAS

    • NAS掛載點:選擇NAS檔案系統和掛載點,EAS服務通過掛載點來訪問NAS檔案系統。

    • NAS源路徑:需要掛載的NAS中的源路徑,即NAS執行個體內部的檔案系統路徑。

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源群組。推薦使用ml.gu7i.c16m60.1-gu30機型(性價比最高)。如果該機型售罄,可以選擇其他機型。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

LLM大語言模型部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

模型來源

模型來源如下:

  • 開源公用模型:您可直接從模型列表中選擇,無需上傳自己的模型,即可快速載入平台預置的LLM大語言模型,並一鍵啟動模型服務。

  • 自持微調模型:您需要通過模型配置來掛載微調後的模型,並設定相應參數,以完成模型的部署。

模型類別

選擇模型類別。

模型配置

模型來源選擇自持微調模型時,需要配置該參數。

支援以下三種配置類型:

  • 按Object Storage Service:選擇微調模型所在的OSS Bucket目錄。

  • 按Apsara File Storage NAS

    • NAS掛載點:選擇NAS檔案系統和掛載點,EAS服務通過掛載點來訪問NAS檔案系統。

    • NAS源路徑:微調模型所在的NAS中的源路徑,即NAS執行個體內部的檔案系統路徑。

  • 按PAI模型:根據模型名稱和模型版本選擇登入的模型。關於如何註冊模型,詳情請參見註冊及管理模型

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源群組。推薦使用ml.gu7i.c16m60.1-gu30機型(性價比最高)。如果該機型售罄,可以選擇其他機型。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

大模型RAG對話系統

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

模型來源

模型來源如下:

  • 開源公用模型:您可直接從模型列表中選擇,無需上傳自己的模型,即可快速載入平台預置的LLM大語言模型,並一鍵啟動模型服務。

  • 自持微調模型:您需要通過模型配置來掛載微調後的模型,並設定相應參數,以完成模型的部署。

模型類別

選擇模型類別。

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

  • 當使用開源公用模型時,系統會根據選定的模型類別自動推薦適合的執行個體規格,預設選中。

  • 當使用自持微調模型時,請選擇與目標模型相匹配的執行個體規格,詳情請參見如何切換其他的開源大模型

推理加速

目前,部署在A10或GU30系列機型上的Qwen、Llama2、ChatGLM或Baichuan2等系列模型服務,支援啟用推理加速功能。支援以下兩種加速類型:

  • PAI-BladeLLM自動推理加速:BladeLLM提供超高性價比的大模型推理加速能力,可協助您一鍵享受高並發和低延時的技術優勢。

  • 開源架構vllm推理加速

向量檢索庫設定

根據您的情境需要,選擇FAISS、Elasticsearch、Milvus、Hologres或AnalyticDB作為向量檢索庫。關於如何建立和配置向量檢索庫,請參見步驟一:準備向量檢索庫步驟二:部署RAG服務

專用網路配置

VPC

  • 當選擇Hologres、Elasticsearch作為向量檢索庫時,請確保所配置的專用網路與選定的向量檢索庫保持一致。

  • 當選擇Faiss作為向量檢索庫時,無需配置專用網路。

交換器

安全性群組

AI視頻產生-ComfyUI部署

參數

描述

基本資料

服務名稱

自訂模型服務名稱。

版本選擇

支援選擇以下版本:

  • 標準版:適用於單使用者使用WebUI或使用一個執行個體調用API情境。支援通過WebUI產生視頻,也可通過API進行調用。

  • API版:系統將自動轉換服務為非同步模式,適用於高並發情境。僅支援通過API進行調用。

  • 叢集版WebUI:適合多使用者同時在WebUI頁面進行操作。僅支援通過WebUI進行調用,不提供API服務。關於該版本的實現原理介紹,請參見叢集版服務原理介紹

更多關於每個版本的使用情境說明,請參見背景資訊

模型配置

當部署微調模型、安裝ComfyUI外掛程式,或選擇API版標準版並通過API進行調用時,您需要單擊添加按鈕,進行模型配置,以便上傳微調模型、外掛程式和擷取推理結果。支援以下兩種配置類型:

  • 按Object Storage Service:單擊image選擇已建立的OSS儲存目錄。

  • 按Apsara File Storage NAS:配置NAS掛載點和NAS源路徑。

後續,您可以將自訂模型和ComfyUI外掛程式上傳至指定的OSS或NAS路徑,以便載入和使用這些資源。具體操作,請參見如何掛載自訂模型和ComfyUI外掛程式?

資源配置

執行個體數

當版本選擇標準版時,建議將執行個體數配置為1。

資源配置選擇

資源規格推薦使用GU30、A10或T4卡型。系統預設選擇GPU > ml.gu7i.c16m60.1-gu30,性價比高。

說明

ComfyUI僅支援單卡(單機單卡或多機單卡)運行,不支援多卡並行作業。

ModelScope模型部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

選擇模型

在下拉式清單中選擇一種可直接部署的ModelScope模型類型。

模型版本

在下拉式清單中選擇模型版本。預設為最新版本。

模型類別

選擇模型後,系統將自動為您匹配相應的模型類別。

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源群組。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

HuggingFace模型部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

模型ID

配置HuggingFace模型ID,例如distilbert-base-uncased-finetuned-sst-2-english

模型類別

配置HuggingFace模型類別,例如text-classification。

模型版本

配置HuggingFace模型版本,例如main。

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源群組。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

Triton部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

模型配置

Triton部署模型需符合特定結構要求,請參照Triton Inference Server鏡像部署進行準備。模型準備就緒後,您可以通過以下任意一種方式選擇配置類型:

  • 按Object Storage Service:選擇模型儲存的OSS目錄。

  • 按Apsara File Storage NAS

    • NAS掛載點:選擇NAS檔案系統和掛載點,EAS服務通過掛載點來訪問NAS檔案系統。如何建立通用型NAS檔案系統,詳情請參見建立檔案系統

    • NAS源路徑:選擇模型儲存在NAS中的源路徑。

  • 按PAI模型:根據模型名稱和模型版本選擇登入的模型。關於如何註冊模型,請參見註冊及管理模型

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

TFServing部署

參數

描述

基本資料

服務名稱

參照介面提示自訂佈建服務名稱。

部署方式

支援以下兩種部署方式:

  • 標準模型部署:用於部署單模型服務。

  • 設定檔部署:用於部署多模型服務。

模型配置

TFServing部署模型需符合特定結構要求,請參照TensorFlow Serving鏡像部署進行準備。

  • 部署方式選擇標準模型部署時,您需要配置模型檔案所在的OSS路徑。

  • 部署方式選擇設定檔部署時,您需要配置以下參數:

    • OSS:選擇模型所在的OSS路徑。

    • 掛載路徑:掛載服務執行個體中的目標路徑,用來讀模數型檔案。

    • 設定檔:選擇模型設定檔所在的OSS路徑。

資源配置

執行個體數

預設為1。建議配置多個服務執行個體,以避免單點部署帶來的風險。

資源配置選擇

選擇部署服務所需的執行個體規格。僅支援使用公用資源群組。

專用網路配置(選填)

VPC

通過配置專用網路,為部署在公用資源群組中的EAS服務開通VPC高速直連。

網路連通後,該VPC環境中的ECS伺服器等即可通過建立的彈性網卡訪問部署在公用資源群組中的EAS服務,同時EAS服務也可以訪問VPC環境中的其他雲產品。

交換器

安全性群組名稱

管理EAS模型線上服務

您可以在模型線上服務頁面的推理服務頁簽,查看已部署的服務列表,並對目標服務進行停止、啟動、刪除等操作。

警告

停止或刪除模型服務,會導致依賴該服務的相關請求失敗,請謹慎操作。

  • 查看服務詳情

    • 單擊目標服務名稱,進入服務詳情頁面。在該頁面查看服務基本資料、服務執行個體和服務配置等。

    • 在服務詳情頁面上方,您可以切換至不同的功能頁簽,以查看服務監控、日誌、部署事件等資訊。

  • 查看容器日誌

    目前EAS在服務執行個體維度已經實現了容器日誌的彙總和過濾,一旦服務執行個體運行失敗,您可以通過查看容器日誌來排查報錯資訊。具體操作步驟如下:

    1. 單擊目標服務名稱,進入服務詳情頁面。

    2. 服務執行個體地區,單擊操作列下的容器列表

    3. 容器列表對話方塊中,單擊操作列下的日誌

  • 更新服務資源配置

    服務詳情頁面,單擊資源資訊地區的資源配置。更新服務啟動並執行資源,配置方法請參見控制台上傳部署

  • 更新已有服務版本

    在推理服務列表中,單擊目標服務操作列下的更新服務,參考控制台上傳部署配置方法,來更新服務版本。

    警告

    服務更新過程中將暫時中斷運行,可能導致依賴此服務的請求失敗,請務必謹慎操作。

    服務更新完成後,單擊目前的版本,查看版本資訊或切換服務版本。image

  • 擴縮容

    在推理服務列表中,單擊目標服務操作列下的擴縮容,配置執行個體數,來提高或減少指定模型服務佔用的資源。

  • Auto Scaling

    根據業務需求,佈建服務以自動調整EAS其佔用的資源。具體操作,請參見方式一:通過控制台管理水平自動擴縮容功能

相關文檔