OSS上的Object會有ETag標籤,ETag主要是用來判斷服務端資料是否存在變化。但是ETag不一定等同於檔案的MD5值,所以不建議作為校正資料一致性的依據。
如果需要校正上傳到OSS的檔案和本地檔案是否一致,可以在上傳檔案時攜帶檔案的Content-MD5值。OSS會在接收檔案時,將檔案的MD5值和Content-MD5進行比對,兩者一致時才可以上傳成功,從而保證上傳資料的一致性。
以訊息內容“0123456789”為例,以下詳細說明正確及錯誤計算該字串的Content-MD5的方法。
正確計算樣本
先計算MD5加密的位元組(128位)。
對該位元組進行base64編碼(而不是對32位字串編碼)。
以Python為例:
>>> import base64,hashlib >>> hash = hashlib.md5() >>> hash.update("0123456789") #在Python 3中此處需要改為hash.update(b"0123456789")。 >>> base64.b64encode(hash.digest()) 'eB5eJF1ptWaXm4bijSPyxw=='
hash.digest(),計算出位元組(128位)。
>>> hash.digest() 'x\x1e^$]i\xb5f\x97\x9b\x86\xe2\x8d#\xf2\xc7'
錯誤計算樣本
說明常見錯誤是直接對計算出的32位字串進行base64編碼。
#hash.hexdigest(),計算得到可見的32位字串編碼。 >>> hash.hexdigest() '781e5e245d69b566979b86e28d23f2c7' # 錯誤的MD5值進行base64編碼後的結果。 >>> base64.b64encode(hash.hexdigest()) 'NzgxZTVlMjQ1ZDY5YjU2Njk3OWI4NmUyOGQyM2YyYzc='
說明
部分Header中的參數(例如Content-MD5)需要加入到signature計算中,且Header和signature需保持一致,否則報錯SignatureDoesNotMatch。關於要簽名的Header,請參見簽名版本1。