全部產品
Search
文件中心

Tablestore:什麼是Tablestore

更新時間:Jun 30, 2024

Tablestore面向海量結構化資料提供Serverless表格儲存體服務,同時針對物聯網情境深度最佳化提供一站式的IoTstore解決方案。適用于海量賬單、IM訊息、物聯網、車連網、風控、推薦等情境中的結構化資料存放區,提供海量資料低成本儲存、毫秒級的線上資料查詢和檢索以及靈活的資料分析能力。

基本概念

在使用Tablestore前,您需要瞭解以下基本概念。

術語

說明

地區

地區(Region)物理的資料中心,Tablestore服務會部署在多個阿里雲地區中,您可以根據自身的業務需求選擇不同地區的Tablestore服務。更多資訊,請參見Table Store已經開通的Region

讀寫輸送量

讀輸送量和寫輸送量的單位為讀服務能力單元和寫服務能力單元,服務能力單元(Capacity Unit,簡稱CU)是資料讀寫操作的最小計費單位。更多資訊,請參見讀寫輸送量

執行個體

執行個體(Instance)是使用和管理Tablestore服務的實體,每個執行個體相當於一個資料庫。Tablestore對應用程式的存取控制和資源計量都在執行個體層級完成。更多資訊,請參見執行個體

服務地址

每個執行個體對應一個服務地址(EndPoint),應用程式在進行表和資料操作時需要指定服務地址。更多資訊,請參見服務地址

資料生命週期

資料生命週期(Time To Live,簡稱TTL)是資料表的一個屬性,即資料的存活時間,單位為秒。Tablestore會在後台對超過存活時間的資料進行清理,以減少您的資料存放區空間,降低儲存成本。更多資訊,請參見資料版本和生命週期

資料存放區模型

Tablestore提供了寬表(WideColumn)模型、時序(TimeSeries)模型和訊息(Timeline)模型三種資料存放區模型,請根據使用情境選擇合適的模型。不同資料存放區模型支援的功能特性請參見功能特性

模型

描述

寬表模型

類Bigtable/HBase模型,可應用於中繼資料、巨量資料等多種情境,支援資料版本、生命週期、主鍵列自增、條件更新、局部事務、原子計數器、過濾器等功能。更多資訊,請參見寬表模型

時序模型

針對時間序列資料的特點進行設計的模型,可應用於物聯網裝置監控、裝置採集資料、機器監控資料等情境,支援自動構建時序中繼資料索引、豐富的時序查詢能力等功能。更多資訊,請參見時序模型

訊息模型

針對訊息資料情境設計的模型,可應用於IM、Feed流等訊息情境。能滿足訊息情境對訊息保序、海量訊息儲存、即時同步的需求,同時支援全文檢索索引與多維度組合查詢。更多資訊,請參見訊息模型

使用方式

您可以通過如下方式使用Tablestore產品。

使用方式

描述

控制台

阿里雲提供的Web服務頁面,方便您便捷的操作Tablestore。更多資訊,請參見Table Store控制台

SDK

支援主流開發語言Java、Go、Python、Node.js.、.Net和PHP。更多資訊,請參見SDK概覽

命令列工具

支援通過簡單的命令操作Tablestore。更多資訊,請參見命令列工具

快速入門

通過控制台或者命令列工具,您可以快速體驗寬表模型中資料表或者時序模型中時序表的操作。更多資訊,請參見快速入門

計算與分析

Tablestore支援通過MaxCompute、Spark、Hive或者HadoopMR、Function Compute、Flink以及TablestoreSQL查詢進行計算與分析,請根據實際情境選擇相應分析工具。

分析工具

適用模型

操作

描述

MaxCompute

寬表模型

使用MaxCompute

通過MaxCompute用戶端為Tablestore的資料表建立外部表格,即可訪問Tablestore中的資料。

Spark

寬表模型

使用Spark計算引擎

使用Spark計算引擎時,支援通過E-MapReduce SQL或者DataFrame編程方式訪問Tablestore

Hive或者HadoopMR

寬表模型

使用Hive或者HadoopMR

使用Hive或者HadoopMR訪問Tablestore中的資料。

Function Compute

寬表模型

使用Function Compute

通過Function Compute訪問Tablestore,對Tablestore增量資料進行Realtime Compute。

Flink

  • 寬表模型

  • 時序模型

使用Flink

通過Realtime ComputeFlink訪問Tablestore中的源表、維表或者結果表,實現巨量資料Realtime Compute與分析。

目前資料表支援作為源表、維表或者結果表,時序表只支援作為結果表。

PrestoDB

寬表模型

通過PrestoDB使用Tablestore

使用PrestoDB對接Tablestore後,基於PrestoDB on Tablestore您可以使用SQL查詢與分析Tablestore中的資料、寫入資料到Tablestore以及匯入資料到Tablestore。

Tablestore多元索引

寬表模型

多元索引

多元索引基於倒排索引和列式儲存,可以解決巨量資料的多維查詢和統計分析難題。當日常業務中有非主鍵列查詢、多列組合查詢、模糊查詢等多維查詢需求,以及求最值、統計行數、資料分組等資料分析需求時,您可以將這些屬性作為多元索引中的欄位,並使用多元索引查詢與分析資料。

TablestoreSQL查詢

  • 寬表模型

  • 時序模型

使用SQL查詢

SQL查詢為多資料引擎提供統一的提供者。通過SQL查詢功能,您可以對Tablestore中資料進行複雜的查詢和高效的分析。

遷移同步

您可以將異構資料平滑遷移同步到Tablestore,還可以將Tablestore資料同步到Object Storage Service(Object Storage Service)等服務中。

分類

資料同步

描述

資料匯入

同步Kafka資料

基於Tablestore Sink Connector將Apache Kafka中的資料大量匯入到Tablestore的資料表或者時序表中。

同步Table Store資料

使用通道服務、DataWorks或者DataX將Tablestore資料表中資料同步到另一個資料表中。

資料匯出

同步到MaxCompute

使用DataWorks將Tablestore中的全量資料匯出到MaxCompute。

同步到OSS

使用DataWorks將Tablestore中的全量資料或者增量資料匯出到OSS。

同步到本地檔案

使用命令列工具或者DataX工具直接下載資料到本地檔案。您也可以使用DataWorks工具將資料同步到OSS後再在OSS側下載資料到本地檔案。

更多功能

  • 如果要控制使用者的存取權限,您可以使用存取控制RAM自訂許可權實現。更多資訊,請參見通過RAM Policy為RAM使用者授權

  • 如果要保證資料存放區安全和網路訪問安全,您可以使用資料表加密、VPC網路訪問等方式實現。更多資訊,請參見資料加密網路安全管理

  • 如果要防止重要資料被誤刪除,您可以使用資料備份功能實現定期備份重要資料。更多資訊,請參見備份Tablestore資料

  • 如果要為監控指標配置警示通知,您可以使用CloudMonitor實現。更多資訊,請參見資料監控與警示

  • 如果要以圖表等形式可視化展示資料,您可以使用DataV或者Grafana實現。更多資訊,請參見資料視覺化工具