您可以使用文本摘要預測組件,對已訓練好的文本摘要模型進行測試,並根據預測結果評估模型的推理效果。本文為您介紹文本摘要預測組件的配置方法。
前提條件
已開通OSS並完成授權,詳情請參見開通OSS服務和雲產品依賴與授權:Designer。
使用限制
僅支援DLC計算資源。
可視化配置組件參數
您可以在Designer中,通過可視化的方式配置組件參數。
輸入樁
輸入樁(從左至右)
類型
建議上遊組件
是否必選
預測資料
OSS
是
預測模型
組件輸出
否
組件配置
頁簽
參數
描述
欄位設定
輸入資料格式
輸入檔案的文本列。預設值為target:str:1,source:str:1。
原文列選擇
原文在輸入表中對應的列名。預設值為source。
輸出追加列選擇
將輸入檔案的若干文本列追加到輸出文本列之後,多列之間使用半形逗號(,)分隔。預設值為source。
輸出資料行選擇
配置資料結果表的列名。預設值為predictions,beams。
預測資料輸出
配置預測結果檔案在OSS Bucket中的路徑。
使用自有模型
是否使用PAI預設模型,進行直接預測。取值如下。
是
否(預設值)
是否為Megatron模型
僅支援文本摘要訓練組件中列出的帶mg首碼的預訓練模型,取值如下。
是
否(預設值)
模型儲存路徑
僅使用自有模型為是時,才需要配置該參數。
自訂模型所在OSS Bucket中的儲存路徑。
參數設定
批次大小
訓練過程中的批處理大小。INT類型,預設值為8。
如果使用多機多卡,則表示每個GPU上的批處理大小。
文本最大長度
表示序列整體最大長度。INT類型,取值範圍為(1,512),預設值為512。
語言
表示當前文本處理的語言:
zh:中文。
en:英文。
是否從原文中拷貝文本
表示是否採用複製機制,取值如下:
false(預設值)
true
解碼器最小長度
表示解碼器最小長度,INT類型,預設值為12。模型輸出長度大於該值。
解碼器最大長度
表示解碼器最大長度,INT類型,預設值為32。模型輸出長度小於該值。
最小不重複欄位
表示不重複的片段大小,INT類型,預設值為2。
集束搜尋數量
表示集束搜尋大小,INT類型,預設值為5。
返回候選答案數量
表示返回結果的數量,INT類型,預設值為5。
重要該參數配置需要與集束搜尋數量相同。
執行調優
GPU機型類型
計算資源的GPU機型,預設值為gn5-c8g1.2xlarge。
使用樣本
您可以使用文本摘要預測組件構建如下工作流程,存在以下兩種調用方式。
方式一:使用文本摘要訓練組件微調過的模型。
方式二:使用自訂模型。
本樣本中,您需要按照以下流程配置組件並運行工作流程:
參照文本摘要訓練組件的使用樣本構建工作流程。
準備需要產生摘要的資料(predict_data.txt),並上傳至OSS的Bucket。本樣本使用的測試資料是通過定位字元分隔的TXT檔案。
同時支援對CSV檔案的處理,您可以通過MaxCompute用戶端的Tunnel命令,將資料集上傳至MaxCompute。關於MaxCompute用戶端的安裝及配置,詳情請參見使用用戶端(odpscmd)串連;關於Tunnel命令的更多內容,詳情請參見Tunnel命令。
使用方式一中的讀OSS資料-3或方式二中的讀OSS資料-1組件讀取測試資料集。即配置讀OSS資料組件的OSS資料路徑參數為存放測試資料集的OSS路徑。
將模型檔案和測試資料集接入文本摘要預測組件,並配置具體參數,詳情請參見可視化配置組件參數。
當使用文本摘要訓練組件微調過的模型時,您需要將文本摘要訓練組件的模型輸出端串連到文本摘要預測的模型輸入端。
當使用自有模型時,您可以將欄位設定頁簽的使用自訂模型參數配置為是,並配置模型儲存路徑參數為儲存模型的OSS路徑。
單擊按鈕運行工作流程。工作流程運行成功後,您可以在文本摘要預測的預測資料輸出參數配置的OSS路徑下,查看輸出的摘要結果。
相關文檔
關於文本摘要訓練組件的配置詳情,請參見文本摘要訓練。