全部產品
Search
文件中心

Object Storage Service:OSS MD5一致性校正說明

更新時間:Feb 28, 2024

OSS上的Object會有ETag標籤,ETag主要是用來判斷服務端資料是否存在變化。但是ETag不一定等同於檔案的MD5值,所以不建議作為校正資料一致性的依據。

如果需要校正上傳到OSS的檔案和本地檔案是否一致,可以在上傳檔案時攜帶檔案的Content-MD5值。OSS會在接收檔案時,將檔案的MD5值和Content-MD5進行比對,兩者一致時才可以上傳成功,從而保證上傳資料的一致性。

以訊息內容“0123456789”為例,以下詳細說明正確及錯誤計算該字串的Content-MD5的方法。

  • 正確計算樣本

    1. 先計算MD5加密的位元組(128位)。

    2. 對該位元組進行base64編碼(而不是對32位字串編碼)。

    以Python為例:

    >>> import base64,hashlib
    >>> hash = hashlib.md5()
    >>> hash.update("0123456789")   #在Python 3中此處需要改為hash.update(b"0123456789")。
    >>> base64.b64encode(hash.digest())
    'eB5eJF1ptWaXm4bijSPyxw=='

    hash.digest(),計算出位元組(128位)。

    >>> hash.digest()
    'x\x1e^$]i\xb5f\x97\x9b\x86\xe2\x8d#\xf2\xc7'
  • 錯誤計算樣本

    說明

    常見錯誤是直接對計算出的32位字串進行base64編碼。

    #hash.hexdigest(),計算得到可見的32位字串編碼。
    >>> hash.hexdigest()
    '781e5e245d69b566979b86e28d23f2c7'
    # 錯誤的MD5值進行base64編碼後的結果。
    >>> base64.b64encode(hash.hexdigest())
    'NzgxZTVlMjQ1ZDY5YjU2Njk3OWI4NmUyOGQyM2YyYzc='
說明

部分Header中的參數(例如Content-MD5)需要加入到signature計算中,且Header和signature需保持一致,否則報錯SignatureDoesNotMatch。關於要簽名的Header,請參見簽名版本1