本文介紹OSS投遞(新版)的穩定性與使用限制。
穩定性說明
讀Log Service
穩定項 | 說明 |
可用性 | 可用性較高。 如果Log Service出錯,無法讀取資料,OSS投遞任務會在內部至少重試10次。如果仍然失敗,任務執行會報錯,然後任務重啟。 |
寫OSS
穩定項 | 說明 |
並發度 | 按照Log ServiceShard進行分區並建立投遞執行個體,支援快速擴容。 如果Log Service源Logstore進行Shard分裂,可以在數秒以內完成投遞執行個體的擴容,加快資料匯出速度。 |
資料不丟失 | OSS投遞任務基於消費組進行擴充,提供一致性保證。投遞完成後,才會提交offset,因此可以保證資料寫入OSS之前,offset不被提交,即保證投遞資料不丟失。 |
監控警示
穩定項 | 說明 |
監控警示 | 資料投遞有完善的監控,可即時追蹤投遞任務的延遲、流量等指標。您可以根據業務需求,配置自訂警示,及時發現投遞問題(例如匯出執行個體不足、網路Quota限制等)。具體操作,請參見為OSS投遞任務(新版)設定警示。 |
使用限制
網路
限制項 | 說明 |
網路類型 | 通過阿里雲內網傳輸資料,網路穩定性和速度具有保障。 |
許可權管理
限制項 | 說明 |
授權 | 涉及OSS投遞操作許可權和資料存取權限。更多資訊,請參見準備許可權。 |
服務端加密 | 如果開啟了服務端加密,需要為RAM角色添加額外的許可權。更多資訊,請參見OSS配置文檔。 |
讀流量
限制項 | 說明 |
讀流量 | 單個Project以及單個Shard存在最高流量限制。更多資訊,請參見資料讀寫。 如果超過最高流量限制,請分裂Shard或者申請擴容Project讀流量限制。超過限制,會導致OSS投遞任務讀取資料失敗,並在內部至少重試10次,如果仍然失敗,任務執行會報錯,然後任務重啟。 |
寫OSS
限制項 | 說明 |
並發執行個體 | 並發執行個體數量與Shard數量相同(包括讀寫Shard和唯讀Shard)。 |
投遞限制 |
|
時間分區 | OSS投遞是攢批進行,每次寫一個檔案,檔案內包括一批資料,檔案路徑由該批資料中最小的receive_time(資料到達Log Service的時間)決定。 |
檔案格式 | 資料被投遞到OSS後,支援儲存為CSV、JSON、Parquet、ORC四種檔案格式。更多資訊,請參見JSON格式、CSV格式、Parquet格式和ORC格式。 |
壓縮方式 | 支援snappy、gzip、zstd三種壓縮方式以及不壓縮。 |
OSS Bucket |
配置項
限制項 | 說明 |
延遲投遞 | 延遲投遞配置項中設定的時間不能超過當前Logstore的資料儲存時間。 建議預留一段緩衝時間,否則可能會導致資料丟失。例如Logstore的資料儲存時間為30天,則延遲投遞的時間最好不要超過25天。 |
管理投遞
限制項 | 說明 |
暫停投遞任務 | 投遞任務會記錄上次投遞的日誌Cursor,恢複運行時從屬記錄的Cursor開始繼續投遞。因此暫停投遞任務時存在如下機制。
|