在百鍊平台,調用大模型實現文本產生任務時,會產生模型推理(調用)費用。
計費項目
計費項目 | 計費說明 | 計費方式 | 計費公式 |
大模型推理(調用) | 所有模型的調用單價和免費額度,請參考模型列表。 調用情境包括:模型調用、應用調用、Prompt 自動最佳化(內建為 Qwen-Plus)。 適合按使用量購買大模型推理服務的需求。 | 後付費(按量) | 模型推理(調用)費用 = 模型調用消耗 x 模型推理(調用)單價 在免費額度內,不會產生費用。查看免費額度請參考新人免費額度。 |
模型推理(調用)計費
完整的模型調用價格和免費額度,請參考模型列表。
計費公式:
文本
文本產生費用 = 模型輸入 Token 數 x 模型輸入單價 + 模型輸出 Token 數 x 模型輸出單價(最低為 0.0003元/千Token)
映像轉成Token:每28x28像素對應一個Token;一張圖最少4個Token。
文本向量、多模態向量、文本分類、文本抽取、文本排序費用 = 模型輸出 Token 數 x 模型單價(最低為 0.0007元/千Token)
模型推理(調用)的免費額度
如何擷取免費額度以及如何查看剩餘免費額度請參考新人免費額度。
旗艦模型推理(調用)計費細則
其他模型的調用價格和免費額度,請參考模型列表。
計費常見問題
在哪裡為百鍊平台的使用付費?
使用時發生餘額不足、欠費等情況請直接前往費用與成本頁面儲值需要的金額。
Token和字串之間怎麼換算?
Token是模型用來表示自然語言文本的基本單位,可以直觀地理解為“字”或“詞”。
對於中文文本,1個Token通常對應一個漢字或詞語。例如,“你好,我是通義千問”會被轉換成['你好', ',', '我是', '通', '義', '千', '問']。
對於英文文本,1個Token通常對應3至4個字母或1個單詞。例如,"Nice to meet you."會被轉換成['Nice', ' to', ' meet', ' you', '.']。
不同的大模型切分Token的方法可能不同。您可以使用SDK在本地查看經過通義千問模型切分後的Token資料。
本地啟動並執行tokenizer可以用來估計文本的Token量,但是得到的結果不保證與模型服務端完全一致,僅供參考。如果您對通義千問的tokenizer細節感興趣,請參考: tokenizer參考。
多輪對話怎麼計費?
在多輪對話中,歷史對話的輸入輸出都會作為新一輪的模型輸入 token 進行計費。
建立了大模型應用會收費嗎?
只建立應用不會收費。但如果調用應用進行了問答,則會根據調用的模型類型收模數型調用費用。
賬單常見問題
查看上個月百鍊的成本支出
在成分分析頁面,成本類型選擇應付金額,時間粒紋選擇月,時間範圍選擇上個月(假設為2024年08月),產品選擇大模型服務平台百鍊,即可查看上個月百鍊的成本支出。
查看模型推理(調用)總花費
在成分分析頁面,成本類型選擇應付金額,選擇時間粒紋和範圍(假設為2024年03月~08月),產品明細選擇大模型推理。
查看具體模型的推理(調用)花費
以模型 qwen-max 為例。在費用與成本頁面,選擇賬期,選擇產品明細為大模型推理,然後單擊搜尋。在執行個體ID列可以找到qwen-max的input_tokens和output_tokens兩個執行個體。將這兩個執行個體對應的應付金額相加,即為所選賬期內調用qwen-max模型所支付的費用。
執行個體ID欄位內容依次為:ApiKeyId,WorkspaceId,ModelName,AmountType和Source。
如何根據明細賬單進行分賬?
比如可以通過業務空間、apikeyid、模型名稱等內容,進行分賬。
您可以前往百鍊API Key管理查看API Key與ApiKeyId的對應關係。
自2024年9月7日以後產生的賬單,可通過執行個體ID資訊進行分賬,其中執行個體ID中包含的資訊是:ApiKeyId、業務空間ID、模型名稱、輸入/輸出類型、調用渠道。可以通過下載賬單表格,按照類型分賬進行資料分析和匯總。
如果您的執行個體ID中沒有包含ApiKeyId,則表示該收費項是通過控制台調用產生的。
相關文檔
如何擷取免費額度、如何查看免費額度用量,請參考新人免費額度。