全部产品
Search
文档中心

人工智能平台 PAI:读数据表

更新时间:Feb 27, 2024

读数据表组件用于读取MaxCompute表数据,默认读取本项目的表数据。如果跨项目读取表数据,则需要在表名前添加项目名。

说明

目前Designer算法组件支持读取的数据类型为DOUBLE、BIGINT、STRING、BOOLEAN、DATETIME。读数据表组件支持读取所有类型数据,为了避免在后续算法组件中报错,您可以在读数据表下游连接类型转换组件进行数据转换。

Designer仅支持通过可视化方式,配置读数据表组件参数,参数详情如下表所示。

页签

参数

描述

表选择

表名

读取的MaxCompute表名称。如果跨项目读取表数据,则表名需要使用项目名.表名格式,例如tianchi_project.weibo_data

重要

如果MaxCompute表字段被修改,Designer算法平台不能自动同步,您需要手动重新配置MaxCompute源。

分区

如果输入表为分区表,您可以选中分区复选框,并配置参数,按分区来查询数据。

说明

如果该组件下游接入SQL脚本组件,则该分区过滤条件不生效,您需要在SQL脚本组件中配置过滤条件。

参数

分区参数,通过该参数来过滤分区表数据。同时筛选多个分区使用半角逗号(,)分隔。如果未配置该参数,则表示输入全表。例如:

  • 动态分区表,输入格式为dt=${yyyyMMdd},其中${yyyyMMdd}是系统参数,表示当前日期,${yyyyMMdd-1d}表示当前日期的前一天。

  • 普通分区表,输入分区条件即可。例如:ds=1,ds=2

  • 多级分区表,通过/分隔多级分区,例如ds=1/name=cat,ds=2/name=dog。

  • 和全局变量配合使用,例如:ds=${a}/name=${b}/tag=${c},其中a,b,c在工作流全局变量中配置。

字段信息

源表字段信息

输入表名后,系统自动读取表的结构数据。