全部產品
Search
文件中心

Platform For AI:最佳化報告

更新時間:Jul 13, 2024

使用PAI-Blade最佳化模型後,系統會輸出最佳化報告。本文詳細介紹最佳化報告的結構及欄位含義。

調用blade.optimize最佳化模型後,會產生一個JSON格式的最佳化報告,其結構如下所示。
Report: {
  // 軟體環境,包括架構、CUDA等。
  "software_context": [
    {
      "software": "tensorflow",
      "version": "1.15.0"
    },
    {
      "software": "cuda",
      "version": "9.0.176"
    }
  ],
  // 硬體環境。
  "hardware_context": {
    "device_type": "gpu",
    "microarchitecture": "T4"
  },
  "user_config": "",
  // 診斷資訊。
  "diagnosis": {
    "model": "tmp_graph.pbtxt",           
    "test_data_source": "user provided",  
    "shape_variation": "dynamic",         
    "message": "",
    "test_data_info": "input_ids_a_1:0 shape: (1, 9240) data type: int32"
  },
  // 產生正最佳化的最佳化項列表。
  "optimizations": [
    {
      "name": "TfStripUnusedNodes", 
      "status": "effective",        
      "speedup": "na",              
      "pre_run": "na",              
      "post_run": "na"              
    },
    {
      "name": "TfAutoMixedPrecisionGpu",
      "status": "effective",
      "speedup": "1.42",
      "pre_run": "9.35 ms",
      "post_run": "6.59 ms"
    }
  ],
  // 端到端最佳化結果。
  "overall": {
    "baseline": "10.00 ms",   
    "optimized": "4.38 ms",   
    "speedup": "2.28"         
  },
  // 模型資訊。
  "model_info": {
    "input_format": "frozen_pb"  
  },
  
  // 相容性列表。
  "compatibility_list": [
    {
      "device_type": "gpu",
      "microarchitecture": "T4"
    }
  ],
  "model_sdk": {}
}
報告中的欄位含義如下表所示。
欄位描述
software_context軟體環境,包括架構、CUDA等。
hardware_context硬體環境資訊,包括裝置類型、規格等。
user_config使用者配置資訊。在PAI-Blade中,該參數為空白。
diagnosismodel模型檔案名稱。
test_data_source測試資料來源,包括如下取值:
  • user provided:表示測試資料是由使用者提供的。
  • blade deduced:表示測試資料是由PAI-Blade推斷出的。
shape_variation輸入形狀的變化情況,包括如下取值:
  • static
  • multiple_static_shapes
  • dynamic
message如果PAI-Blade推斷測試資料失敗,則會輸出相關報錯資訊。
test_data_info測試資料資訊,包括形狀,資料類型等資訊。
optimizationsname最佳化項名稱。
status最佳化是否生效,包括如下取值:
  • effective:生效
  • ineffective:無效
speedup加速比,計算公式為speedup = pre_run / post_run
pre_run最佳化前的速度。
post_run最佳化後的速度。
overallbaseline加速前的延遲。
optimized加速後的延遲。
speedup加速比,計算公式為speedup = baseline / optimized
model_infoinput_format原始模型格式。
compatibility_list相容性列表,即最佳化結果必須在列表中的裝置上才能正常執行,並且效能達到預期。
model_sdk模型部署需要的額外SDK資訊,目前該參數均為空白。