Tablestore面向海量結構化資料提供Serverless表格儲存體服務,同時針對物聯網情境深度最佳化提供一站式的IoTstore解決方案。適用于海量賬單、IM訊息、物聯網、車連網、風控、推薦等情境中的結構化資料存放區,提供海量資料低成本儲存、毫秒級的線上資料查詢和檢索以及靈活的資料分析能力。
基本概念
在使用Tablestore前,您需要瞭解以下基本概念。
術語 | 說明 |
地區 | 地區(Region)物理的資料中心,Tablestore服務會部署在多個阿里雲地區中,您可以根據自身的業務需求選擇不同地區的Tablestore服務。更多資訊,請參見Table Store已經開通的Region。 |
讀寫輸送量 | 讀輸送量和寫輸送量的單位為讀服務能力單元和寫服務能力單元,服務能力單元(Capacity Unit,簡稱CU)是資料讀寫操作的最小計費單位。更多資訊,請參見讀寫輸送量。 |
執行個體 | 執行個體(Instance)是使用和管理Tablestore服務的實體,每個執行個體相當於一個資料庫。Tablestore對應用程式的存取控制和資源計量都在執行個體層級完成。更多資訊,請參見執行個體。 |
服務地址 | 每個執行個體對應一個服務地址(EndPoint),應用程式在進行表和資料操作時需要指定服務地址。更多資訊,請參見服務地址。 |
資料生命週期 | 資料生命週期(Time To Live,簡稱TTL)是資料表的一個屬性,即資料的存活時間,單位為秒。Tablestore會在後台對超過存活時間的資料進行清理,以減少您的資料存放區空間,降低儲存成本。更多資訊,請參見資料版本和生命週期。 |
資料存放區模型
Tablestore提供了寬表(WideColumn)模型、時序(TimeSeries)模型和訊息(Timeline)模型三種資料存放區模型,請根據使用情境選擇合適的模型。不同資料存放區模型支援的功能特性請參見功能特性。
模型 | 描述 |
寬表模型 | 類Bigtable/HBase模型,可應用於中繼資料、巨量資料等多種情境,支援資料版本、生命週期、主鍵列自增、條件更新、局部事務、原子計數器、過濾器等功能。更多資訊,請參見寬表模型。 |
時序模型 | 針對時間序列資料的特點進行設計的模型,可應用於物聯網裝置監控、裝置採集資料、機器監控資料等情境,支援自動構建時序中繼資料索引、豐富的時序查詢能力等功能。更多資訊,請參見時序模型。 |
訊息模型 | 針對訊息資料情境設計的模型,可應用於IM、Feed流等訊息情境。能滿足訊息情境對訊息保序、海量訊息儲存、即時同步的需求,同時支援全文檢索索引與多維度組合查詢。更多資訊,請參見訊息模型。 |
使用方式
您可以通過如下方式使用Tablestore產品。
使用方式 | 描述 |
控制台 | 阿里雲提供的Web服務頁面,方便您便捷地操作Tablestore。更多資訊,請參見Table Store控制台。 |
SDK | 支援主流開發語言Java、Go、Python、Node.js.、.Net和PHP。更多資訊,請參見SDK概覽。 |
命令列工具 | 支援通過簡單的命令操作Tablestore。更多資訊,請參見命令列工具。 |
快速入門
通過控制台或者命令列工具,您可以快速體驗寬表模型中資料表或者時序模型中時序表的操作。更多資訊,請參見快速入門。
計算與分析
Tablestore支援通過MaxCompute、Spark、Hive或者HadoopMR、Function Compute、Flink以及TablestoreSQL查詢進行計算與分析,請根據實際情境選擇相應分析工具。
分析工具 | 適用模型 | 操作 | 描述 |
MaxCompute | 寬表模型 | 通過MaxCompute用戶端為Tablestore的資料表建立外部表格,即可訪問Tablestore中的資料。 | |
Spark | 寬表模型 | 使用Spark計算引擎時,支援通過E-MapReduce SQL或者DataFrame編程方式訪問Tablestore。 | |
Hive或者HadoopMR | 寬表模型 | 使用Hive或者HadoopMR訪問Tablestore中的資料。 | |
Function Compute | 寬表模型 | 通過Function Compute訪問Tablestore,對Tablestore增量資料進行Realtime Compute。 | |
Flink |
| 通過Realtime ComputeFlink訪問Tablestore中的源表、維表或者結果表,實現巨量資料Realtime Compute與分析。 目前資料表支援作為源表、維表或者結果表,時序表只支援作為結果表。 | |
PrestoDB | 寬表模型 | 使用PrestoDB對接Tablestore後,基於PrestoDB on Tablestore您可以使用SQL查詢與分析Tablestore中的資料、寫入資料到Tablestore以及匯入資料到Tablestore。 | |
Tablestore多元索引 | 寬表模型 | 多元索引基於倒排索引和列式儲存,可以解決巨量資料的多維查詢和統計分析難題。當日常業務中有非主鍵列查詢、多列組合查詢、模糊查詢等多維查詢需求,以及求最值、統計行數、資料分組等資料分析需求時,您可以將這些屬性作為多元索引中的欄位,並使用多元索引查詢與分析資料。 | |
TablestoreSQL查詢 |
| SQL查詢為多資料引擎提供統一的提供者。通過SQL查詢功能,您可以對Tablestore中資料進行複雜的查詢和高效的分析。 |
遷移同步
您可以將異構資料平滑遷移同步到Tablestore,還可以將Tablestore資料同步到Object Storage Service(Object Storage Service)等服務中。
分類 | 資料同步 | 描述 |
資料匯入 | 基於Tablestore Sink Connector將Apache Kafka中的資料大量匯入到Tablestore的資料表或者時序表中。 | |
使用通道服務、DataWorks或者DataX將Tablestore資料表中資料同步到另一個資料表中。 | ||
資料匯出 | 使用DataWorks將Tablestore中的全量資料匯出到MaxCompute。 | |
使用DataWorks將Tablestore中的全量資料或者增量資料匯出到OSS。 | ||
使用命令列工具或者DataX工具直接下載資料到本地檔案。您也可以使用DataWorks工具將資料同步到OSS後再在OSS側下載資料到本地檔案。 |
更多功能
如果要控制使用者的存取權限,您可以使用存取控制RAM自訂許可權實現。更多資訊,請參見通過RAM Policy為RAM使用者授權。
您還可以通過資來源目錄的管控策略、Table StoreNetwork ACL、Table Store執行個體策略進一步限制使用者的存取權限。更多資訊,請參見許可權控制概述。
如果要保證資料存放區安全和網路訪問安全,您可以使用資料表加密、VPC網路訪問等方式實現。更多資訊,請參見資料加密和網路安全管理。
如果要防止重要資料被誤刪除,您可以使用資料備份功能實現定期備份重要資料。更多資訊,請參見備份Tablestore資料。
如果要為監控指標配置警示通知,您可以使用CloudMonitor實現。更多資訊,請參見資料監控與警示。
如果要以圖表等形式可視化展示資料,您可以使用DataV或者Grafana實現。更多資訊,請參見資料視覺化工具。