全部產品
Search
文件中心

Alibaba Cloud Model Studio:大模型產品計費

更新時間:Dec 17, 2024

在百鍊平台,調用大模型實現文本產生任務時,會產生模型推理(調用)費用。

計費項目

計費項目

計費說明

計費方式

計費公式

大模型推理(調用)

所有模型的調用單價和免費額度,請參考模型列表

調用情境包括:模型調用應用調用Prompt 自動最佳化(內建為 Qwen-Plus)。

適合按使用量購買大模型推理服務的需求。

後付費(按量)

模型推理(調用)費用 = 模型調用消耗 x 模型推理(調用)單價

在免費額度內,不會產生費用。查看免費額度請參考新人免費額度

模型推理(調用計費

完整的模型調用價格和免費額度,請參考模型列表

計費公式:

文本

文本產生費用 = 模型輸入 Token 數 x 模型輸入單價 + 模型輸出 Token 數 x 模型輸出單價(最低為 0.0003元/千Token)

映像轉成Token:每28x28像素對應一個Token;一張圖最少4個Token。

文本向量、多模態向量、文本分類、文本抽取、文本排序費用 = 模型輸出 Token 數 x 模型單價(最低為 0.0007元/千Token)

模型推理(調用)的免費額度

如何擷取免費額度以及如何查看剩餘免費額度請參考新人免費額度

旗艦模型推理(調用)計費細則

其他模型的調用價格和免費額度,請參考模型列表

計費常見問題

在哪裡為百鍊平台的使用付費?

使用時發生餘額不足、欠費等情況請直接前往費用與成本頁面儲值需要的金額。

Token和字串之間怎麼換算?

Token是模型用來表示自然語言文本的基本單位,可以直觀地理解為“字”或“詞”。

  • 對於中文文本,1個Token通常對應一個漢字或詞語。例如,“你好,我是通義千問”會被轉換成['你好', ',', '我是', '通', '義', '千', '問']。

  • 對於英文文本,1個Token通常對應3至4個字母或1個單詞。例如,"Nice to meet you."會被轉換成['Nice', ' to', ' meet', ' you', '.']。

不同的大模型切分Token的方法可能不同。您可以使用SDK在本地查看經過通義千問模型切分後的Token資料。

查看經過通義千問模型切分後的Token資料

# 運行前請 pip install tiktoken
from dashscope import get_tokenizer  # dashscope版本 >= 1.14.0

# 擷取tokenizer對象,目前只支援通義千問系列模型
tokenizer = get_tokenizer('qwen-turbo')

input_str = '通義千問具有強大的能力。'

# 將字串切分成token並轉換為token id
tokens = tokenizer.encode(input_str)
print(f"經過切分後的token id為:{tokens}。")
print(f"經過切分後共有{len(tokens)}個token")

# 將token id轉化為字串並列印出來
for i in range(len(tokens)):
    print(f"token id為{tokens[i]}對應的字串為:{tokenizer.decode(tokens[i])}")
// Copyright (c) Alibaba, Inc. and its affiliates.
// dashscope SDK版本 >= 2.13.0
import java.util.List;
import com.alibaba.dashscope.exception.NoSpecialTokenExists;
import com.alibaba.dashscope.exception.UnSupportedSpecialTokenMode;
import com.alibaba.dashscope.tokenizers.Tokenizer;
import com.alibaba.dashscope.tokenizers.TokenizerFactory;

public class Main {
  public static void testEncodeOrdinary(){
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt ="如果現在要你走十萬八千裡路,需要多長的時間才能到達? ";
    // encode string with no special tokens
    List<Integer> ids = tokenizer.encodeOrdinary(prompt);
    System.out.println(ids);
    String decodedString = tokenizer.decode(ids);
    assert decodedString == prompt;
  }

  public static void testEncode() throws NoSpecialTokenExists, UnSupportedSpecialTokenMode{
    Tokenizer tokenizer = TokenizerFactory.qwen();
    String prompt = "<|im_start|>system\nYour are a helpful assistant.<|im_end|>\n<|im_start|>user\nSanFrancisco is a<|im_end|>\n<|im_start|>assistant\n";
    // encode string with special tokens <|im_start|> and <|im_end|>
    List<Integer> ids = tokenizer.encode(prompt, "all");
    // 24 tokens [151644, 8948, 198, 7771, 525, 264, 10950, 17847, 13, 151645, 198, 151644, 872, 198, 23729, 80328, 9464, 374, 264, 151645, 198, 151644, 77091, 198]
    String decodedString = tokenizer.decode(ids);
    System.out.println(ids);
    assert decodedString == prompt;

  }

  public static void main(String[] args) {
      try {
        testEncodeOrdinary();
        testEncode();
      } catch (NoSpecialTokenExists | UnSupportedSpecialTokenMode e) {
        e.printStackTrace();
      }
  }
}

本地啟動並執行tokenizer可以用來估計文本的Token量,但是得到的結果不保證與模型服務端完全一致,僅供參考。如果您對通義千問的tokenizer細節感興趣,請參考: tokenizer參考

多輪對話怎麼計費?

在多輪對話中,歷史對話的輸入輸出都會作為新一輪的模型輸入 token 進行計費。

建立了大模型應用會收費嗎?

只建立應用不會收費。但如果調用應用進行了問答,則會根據調用的模型類型收模數型調用費用。

賬單常見問題

查看上個月百鍊的成本支出

成分分析頁面,成本類型選擇應付金額,時間粒紋選擇月,時間範圍選擇上個月(假設為2024年08月),產品選擇大模型服務平台百鍊,即可查看上個月百鍊的成本支出。

image

查看模型推理(調用)總花費

成分分析頁面,成本類型選擇應付金額,選擇時間粒紋和範圍(假設為2024年03月~08月),產品明細選擇大模型推理

image

查看具體模型的推理(調用)花費

以模型 qwen-max 為例。在費用與成本頁面,選擇賬期,選擇產品明細為大模型推理,然後單擊搜尋。在執行個體ID列可以找到qwen-max的input_tokens和output_tokens兩個執行個體。將這兩個執行個體對應的應付金額相加,即為所選賬期內調用qwen-max模型所支付的費用。

執行個體ID欄位內容依次為:ApiKeyId,WorkspaceId,ModelName,AmountType和Source。

image

如何根據明細賬單進行分賬?

比如可以通過業務空間、apikeyid、模型名稱等內容,進行分賬。

您可以前往百鍊API Key管理查看API Key與ApiKeyId的對應關係。

自2024年9月7日以後產生的賬單,可通過執行個體ID資訊進行分賬,其中執行個體ID中包含的資訊是:ApiKeyId、業務空間ID、模型名稱、輸入/輸出類型、調用渠道。可以通過下載賬單表格,按照類型分賬進行資料分析和匯總。

如果您的執行個體ID中沒有包含ApiKeyId,則表示該收費項是通過控制台調用產生的。

image

相關文檔

如何擷取免費額度、如何查看免費額度用量,請參考新人免費額度