借助阿里云在亚洲加速迈向成功
一站式安全合规咨询服务
MLPS 2.0 一站式合规解决方案
依托我们的网络进军中国市场
提升面向互联网应用的性能和安全性
保障您的中国业务安全无忧
通过强大的数据安全框架保护您的数据资产
申请 ICP 备案的流程解读和咨询服务
面向大数据建设、管理及应用的全域解决方案
企业内大数据建设、管理和应用的一站式解决方案
将您的采购和销售置于同一企业级全渠道数字平台上
全渠道内置 AI 驱动、拟人化、多语言对话的聊天机器人
快速搭建在线教育平台
提供域名注册、分析和保护服务
云原生 Kubernetes 容器化应用运行环境
以 Kubernetes 为使用界面的容器服务产品,提供符合容器规范的算力资源
安全的镜像托管服务,支持全生命周期管理
多集群环境下微服务应用流量统一管理
提供任意基础设施上容器集群的统一管控,助您轻松管控分布式云场景
高弹性、高可靠的企业级无服务器 Kubernetes 容器产品
敏捷安全的 Serverless 容器运行服务
为虚拟机和容器提供高可靠性、高性能、低时延的块存储服务
一款海量、安全、低成本、高可靠的云存储服务
可靠、弹性、高性能、多共享的文件存储服务
全托管、可扩展的并行文件系统服务。
全托管的 NoSQL 结构化数据实时存储服务
可抵扣多种存储产品的容量包,兼具灵活性和长期成本优化
让您的应用跨不同可用区资源自动分配访问量
随时绑定和解绑 VPC ECS
云网络公网、跨域流量统一计费
高性价比,可抵扣按流量计费的流量费用
创建云上隔离的网络,在专有环境中运行资源
在 VPC 环境下构建公网流量的出入口
具备网络状态可视化、故障智能诊断能力的自助式网络运维服务。
安全便捷的云上服务专属连接
基于阿里云专有网络的私有 DNS 解析服务
保障在线业务不受大流量 DDoS 攻击影响
系统运维和安全审计管控平台
业务上云的第一个网络安全基础设施
集零信任内网访问、办公数据保护、终端管理等多功能于一体的办公安全管控平台
提供7X24小时安全运维平台
防御常见 Web 攻击,缓解 HTTP 泛洪攻击
实现全站 HTTPS,呈现可信的 WEB 访问
为云上应用提供符合行业标准和密码算法等级的数据加解密、签名验签和数据认证能力
一款发现、分类和保护敏感数据的安全服务
创建、控制和管理您的加密密钥
快速提高应用高可用能力服务
围绕应用和微服务的 PaaS 平台
兼容主流开源微服务生态的一站式平台
多集群环境下微服务应用流量统一管理
Super MySQL 和 PostgreSQL,高度兼容 Oracle 语法
全托管 MySQL、PostgreSQL、SQL Server、MariaDB
兼容 Redis® 的缓存和KV数据库
兼容Apache Cassandra、Apache HBase、Elasticsearch、OpenTSDB 等多种开源接口
文档型数据库,支持副本集和分片架构
100%兼容 Apache HBase 并深度扩展,稳定、易用、低成本的NoSQL数据库。
低成本、高可用、可弹性伸缩的在线时序数据库服务
专为搜索和分析而设计,成本效益达到开源的两倍,采用最新的企业级AI搜索和AI助手功能。
一款兼容PostgreSQL协议的实时交互式分析产品
一种快速、完全托管的 TB/PB 级数据仓库
基于 Flink 为大数据行业提供解决方案
基于Qwen和其他热门模型的一站式生成式AI平台,可构建了解您业务的智能应用程
一站式机器学习平台,满足数据挖掘分析需求
高性能向量检索服务,提供低代码API和高成本效益
帮助您的应用快速构建高质量的个性化推荐服务能力
提供定制化的高品质机器翻译服务
全面的AI计算平台,满足大模型训练等高性能AI计算的算力和性能需求
具备智能会话能力的会话机器人
基于机器学习的智能图像搜索产品
基于阿里云深度学习技术,为用户提供图像分割、视频分割、文字识别等离线SDK能力,支持Android、iOS不同的适用终端。
语音识别、语音合成服务以及自学习平台
一站式智能搜索业务开发平台
助力金融企业快速搭建超低时延、高质量、稳定的行情数据服务
帮助企业快速测算和分析企业的碳排放和产品碳足迹
企业工作流程自动化,全面提高效率
金融级云原生分布式架构的一站式高可用应用研发、运维平台
eKYC 数字远程在线解决方案
可智能检测、大数据驱动的综合性反洗钱 (AML) 解决方案
阿里云APM类监控产品
实时云监控服务,确保应用及服务器平稳运行
为系统运维人员管理云基础架构提供全方位服务的云上自动化运维平台
面向您的云资源的风险检测服务
提升分布式环境下的诊断效率
日志类数据一站式服务,无需开发就能部署
ECS 预留实例
让弹性计算产品的成本和灵活性达到最佳平衡的付费方式。云原生 AI 套件
加速AI平台构建,提高资源效率和交付速度FinOps
实时分析您的云消耗并实现节约SecOps
实施细粒度安全控制DevOps
快速、安全地最大限度提高您的DevOps优势自带IP上云
自带公网 IP 地址上云全球网络互联
端到端的软件定义网络解决方案,可推动跨国企业的业务发展全球应用加速
提升面向互联网应用的性能和安全性全球互联网接入
将IDC网关迁移到云端云原生 AI 套件
加速AI平台构建,提高资源效率和交付速度FinOps
实时分析您的云消耗并实现节约SecOps
实施细粒度安全控制DevOps
快速、安全地最大限度提高您的DevOps优势金融科技云数据库解决方案
利用专为金融科技而设的云原生数据库解决方案游戏行业云数据库解决方案
提供多种成熟架构,解决所有数据问题Oracle 数据库迁移
将 Oracle 数据库顺利迁移到云原生数据库数据库迁移
加速迁移您的数据到阿里云阿里云上的数据湖
实时存储、管理和分析各种规模和类型的数据数码信贷
利用大数据和 AI 降低信贷和黑灰产风险面向企业数据技术的大数据咨询服务
帮助企业实现数据现代化并规划其数字化未来人工智能对话服务
全渠道内置 AI 驱动、拟人化、多语言对话的聊天机器人EasyDispatch 现场服务管理
为现场服务调度提供实时AI决策支持在线教育
快速搭建在线教育平台窄带高清 (HD) 转码
带宽成本降低高达 30%广电级大型赛事直播
为全球观众实时直播大型赛事,视频播放流畅不卡顿直播电商
快速轻松地搭建一站式直播购物平台用于供应链规划的Alibaba Dchain
构建和管理敏捷、智能且经济高效的供应链云胸牌
针对赛事运营的创新型凭证数字服务数字门店中的云 POS 解决方案
将所有操作整合到一个云 POS 系统中元宇宙
元宇宙是下一代互联网人工智能 (AI) 加速
利用阿里云 GPU 技术,为 AI 驱动型业务以及 AI 模型训练和推理加速DevOps
快速、安全地最大限度提高您的DevOps优势数据迁移解决方案
加速迁移您的数据到阿里云企业 IT 治理
在阿里云上构建高效可控的云环境基于日志管理的AIOps
登录到带有智能化日志管理解决方案的 AIOps 环境备份与存档
数据备份、数据存档和灾难恢复用阿里云金融服务加快创新
在云端开展业务,提升客户满意度
为全球资本市场提供安全、准确和数字化的客户体验
利用专为金融科技而设的云原生数据库解决方案
利用大数据和 AI 降低信贷和黑灰产风险
建立快速、安全的全球外汇交易平台
新零售时代下,实现传统零售业转型
利用云服务处理流量波动问题,扩展业务运营、降低成本
快速轻松地搭建一站式直播购物平台
面向大数据建设、管理及应用的全域解决方案
全渠道内置 AI 驱动、拟人化、多语言对话的聊天机器人
以数字化媒体旅程为当今的媒体市场准备就绪您的内容
带宽成本降低高达 30%
快速轻松地搭建一站式直播购物平台
为全球观众实时直播大型赛事,视频播放流畅不卡顿
使用阿里云弹性高性能计算 E-HPC 将本地渲染农场连接到云端
构建发现服务,帮助客户找到最合适的内容
保护您的媒体存档安全
通过统一的数据驱动平台提供一致的全生命周期客户服务
在钉钉上打造一个多功能的电信和数字生活平台
在线存储、共享和管理照片与文件
提供全渠道的无缝客户体验
面向中小型企业,为独立软件供应商提供可靠的IT服务
打造最快途径,助力您的新云业务扬帆起航
先进的SD-WAN平台,可实现WAN连接、实时优化并降低WAN成本
通过自动化和流程标准化实现快速事件响应
针对关键网络安全威胁提供集中可见性并进行智能安全分析
提供大容量、可靠且高度安全的企业文件传输
用智能技术数字化体育赛事
基于人工智能的低成本体育广播服务
专业的广播转码及信号分配管理服务
基于云的音视频内容引入、编辑和分发服务
在虚拟场馆中模拟关键运营任务
针对赛事运营的创新型凭证数字服务
智能和交互式赛事指南
轻松管理云端背包单元的绑定直播流
通过数据加强您的营销工作
元宇宙是下一代互联网
利用生成式 AI 加速创新,创造新的业务佳绩
阿里云高性能开源大模型
借助AI轻松解锁和提炼文档中的知识
通过AI驱动的语音转文本服务获取洞察
探索阿里云人工智能和数据智能的所有功能、新优惠和最新产品
该体验中心提供广泛的用例和产品帮助文档,助您开始使用阿里云 AI 产品和浏览您的业务数据。
利用阿里云 GPU 技术,为 AI 驱动型业务以及 AI 模型训练和推理加速
元宇宙是下一代互联网
构建发现服务,帮助客户找到最合适的内容
全渠道内置 AI 驱动、拟人化、多语言对话的聊天机器人
加速迁移您的数据到阿里云
在阿里云上建立一个安全且易扩容的环境,助力高效率且高成本效益的上云旅程
迁移到完全托管的云数据库
将 Oracle 数据库顺利迁移到云原生数据库
自带公网 IP 地址上云
利用阿里云强大的安全工具集,保障业务安全、应用程序安全、数据安全、基础设施安全和帐户安全
保护、备份和还原您的云端数据资产
MLPS 2.0 一站式合规解决方案
快速高效地将您的业务扩展到中国,同时遵守适用的当地法规
实现对 CloudOps、DevOps、SecOps、AIOps 和 FinOps 的高效、安全和透明的管理
构建您的原生云环境并高效管理集群
快速、安全地最大限度提高您的DevOps优势
实施细粒度安全控制
提供运维效率和总体系统安全性
实时分析您的云消耗并实现节约
实时存储、管理和分析各种规模和类型的数据
登录到带有智能化日志管理解决方案的 AIOps 环境
帮助企业实现数据现代化并规划其数字化未来
帮助零售商快速规划数字化之旅
将全球知名的 CRM 平台引入中国
在线存储、共享和管理照片与文件
构建、部署和管理高可用、高可靠、高弹性的应用程序
快速、安全地最大限度提高您的DevOps优势
将您的采购和销售置于同一企业级全渠道数字平台上
企业内大数据建设、管理和应用的一站式解决方案
帮助企业简化 IT 架构、实现商业价值、加速数字化转型的步伐
快速高效地将您的业务扩展到中国,同时遵守适用的当地法规
快速搜集、处理、分析联网设备产生的数据
0.0.201
数据安全中心 DSC(Data Security Center)提供数据洞察能力,通过管理敏感数据识别任务,可协助您识别已授权资产中存在的敏感信息,并进行分类分级管理,包括敏感数据的位置、敏感类型和级别等。掌握数据资产中敏感数据有助于正确管理对应资产的访问权限,从而提升数据安全性。本文介绍如何使用识别任务扫描敏感数据。
识别任务是根据识别模板内的识别模型对接入资产的数据进行扫描并发现敏感数据,生成扫描结果并对发现的敏感数据进行分类分级。识别模板的详细使用说明,请参见查看和配置识别模板。
数据安全中心针对敏感数据扫描提供两种识别任务:系统默认任务和自定义识别任务。
完成数据资产授权后,DSC会使用主用识别模板为每一个资产实例创建一个扫描任务,此类任务统称为系统默认任务。主用识别模板的详细说明,请参见如何使用识别模板。
数据资产授权的具体操作,请参见资产授权。下表是关于系统默认任务您需要了解的信息。
任务配置项 | 说明 |
识别模板 | 系统默认任务使用主用识别模板,不可修改。如果主用识别模板是内置识别模板,会同时使用通用识别模板。
|
扫描周期(默认) |
两次扫描至少间隔24小时。 |
扫描范围 | 对于已完成资产授权的所有资产:
如果您切换了主用识别模板,不会立即触发扫描。在下次系统默认任务执行时,才会启用新的识别模板进行扫描。 |
您可以添加自定义识别任务,使用已启用识别模板扫描指定数据资产。如果需要使用的识别模板未启用,您需要先启用该识别模板。具体操作,请参见启用识别模板。
为了避免数据源中文件或表过大影响整体扫描进度,数据安全中心对可以扫描的文件大小或表的字段大小做了限制,请您在进行敏感数据扫描前了解以下规则:
结构化数据(RDS MySQL、RDS PostgreSQL、PolarDB等)、大数据(TableStore、MaxCompute等):采样时取表中的前200行数据,仅扫描采样数据中每个字段每行的前10 KB数据。
非结构化数据(OSS、SLS):
单个文件如果超过200 MB,则不扫描;如果未超过200 MB,则全量扫描。
对于OSS数据:
压缩或归档文件,只扫描其下前1000个子文件。
扫描单个OSS Bucket时,支持并发扫描文件的最大数量为4个。
QPS占用限制:单个任务扫描时,占用对应OSS Bucket的OpenAPI调用次数最大为100次/秒。
带宽占用限制:单任务扫描时,占用对应OSS Bucket内网的下行流量带宽最大为200 MB/秒。
目前支持扫描的OSS文件类目有文本文件、办公文件、图像文件、设计文档、代码文件、数据文件、二进制文件、验签文件、归档文件、应用程序、音视频文件、化学结构文件和其他类别,包含800+文件类型。具体内容,请参见支持识别的OSS文件类型。
识别任务的更多使用限制,请参见使用限制。
数据库资产:<实例>/<数据库>/<表名称>。每个数据表作为识别任务扫描的一个数据对象。
大数据:<实例>/<表名称>。每个数据表作为识别任务扫描的一个数据对象。
OSS资产:<OSS Bucket>/<文件名称>。每个文件作为识别任务扫描的一个数据对象。
SLS资产:<SLS Project>/<logstore>/<时间周期>。每5分钟作为一个时间周期,每个时间周期内存储的数据作为识别任务扫描的一个数据对象。
不同类型数据资产的扫描速度说明如下,该扫描速度仅供参考:
结构化数据(RDS MySQL、RDS PostgreSQL、PolarDB等)、大数据(TableStore、MaxCompute等):对于较大的数据库(即表数量大于1000个),扫描速度为1000列/分钟。
非结构化数据(OSS、SLS):扫描1 TB数据需要6小时~48小时(因1 TB数据中不同文件类型分布会导致扫描时长区间跨度大),平均时长为24小时。
任务类型 | 首次扫描 | 重新扫描 |
系统默认任务 | 全量扫描目标资产中现有的全部数据。 | 对新增或存在修改的数据对象进行扫描。 您可以手动执行重扫操作,也可以配置系统默认任务的扫描周期。 |
自定义识别任务 | 按照您自定义的扫描范围进行扫描。 | 按照您自定义的扫描周期,对扫描范围内新增或存在修改的数据对象进行扫描。 |
重新扫描时,对于已扫描过的数据对象,如果没有任何变更,DSC不会对其进行重复扫描。
识别任务扫描结果的敏感等级,由该识别任务使用的识别模板中命中的识别模型的敏感等级决定,以命中的最高敏感等级为准。DSC的敏感数据识别以S1、S2、S3、S4...S10定义敏感等级,数字越大敏感等级越高。N/A表示未识别到敏感数据。
识别模型可选的敏感等级范围由关联的识别模板包含的敏感级别决定。具体设置,请参见设置识别模板的敏感级别。
建议项 | 说明 |
建议项 | 说明 |
确认扫描范围和优先级 | 开始进行敏感数据扫描时,会存在较多积压的数据需要分类分级,而无法立即扫描所有数据。建议您先评估您数据资产中哪些资产的扫描优先级较高,选择潜在风险较高的数据,例如经常被访问、更新或未知操作的数据,优先进行扫描。 |
限制首次扫描范围 | 为达到最佳扫描效果,您可以指定扫描范围不进行全量扫描。例如从一个数据库、一个OSS Bucket或几个文件开始,通过限制首次扫描范围,可以更好地确定要启用哪些识别特性以及可能使用哪些特征规则,更有利于发现有意义的敏感数据。 如果您不需要使用所有识别特征,建议不要启用所有识别特征,因为误报或无效的识别结果可能会让评估风险变得更加困难。虽然在某些情况下,例如日期、时间、URL等类型数据,启用所有识别特征,可以匹配广泛的结果,但这也可能不适用于大型数据扫描。 对结构化数据的扫描,需要确保样本大小足够,否则无法检出扫描结果。 |
设置任务启动时间 | 建议您根据数据资产的更新频率,将识别任务的启动时间设置为每天、每周或每月的某段时间自动运行扫描并生成扫描结果,以便检查自上次扫描后发生变化的数据,从而及时发现变化数据中存在的敏感信息,且定期运行扫描可帮助您识别扫描结果中的趋势或异常值。 |
已在DSC完成目标资产的授权,并为资产开启识别权限。具体操作,请参见资产授权。
登录数据安全中心控制台。
在左侧导航栏,选择分类分级 > 任务管理。
在任务管理页面识别任务页签,单击系统默认任务。
在识别任务监控页面,查看默认任务列表。
您可在系统默认任务的操作列执行以下操作。
重扫:如果识别模型进行了升级、您更换了主用模板或数据库内容有变更,需要尽快获取扫描结果时,可以执行重扫操作。
暂停:如果您发现数据库业务存在异常,可以单击默认识别任务操作列的暂停,暂时停止正在扫描的系统默认任务。
终止:该功能是指终止后续系统默认任务的执行,如果系统默认任务正在扫描中,执行终止操作不会影响当前任务的执行,但后续该系统默认任务将不会被执行。
开启:该功能会重新开启已被终止的系统默认任务。
系统默认任务不支持删除。
系统默认任务支持设置周期性扫描。建议您将扫描周期设置为与数据库内容更新的频率大致一致,以便及时发现数据库中的变化数据存在的敏感信息。可设置的最小的扫描周期为每天。
登录数据安全中心控制台。
在左侧导航栏,选择分类分级 > 任务管理。
在任务管理页面识别任务页签,单击系统默认任务。
在识别任务监控页面,选中需要设置扫描周期的任务前的复选框,单击任务列表上方的扫描设置。
在扫描设置对话框,设置扫描周期和自动扫描开始时间,然后单击确定。
为了将扫描对数据库的影响降到最低,建议您将扫描开始时间设置为数据资产调用低峰期的时段。
在扫描任务执行期间,建议您观察数据库或业务状态,例如CPU使用率、内存使用率是否存在异常突增。如果发现业务异常且异常现象和扫描任务相关,建议您及时暂停或终止识别任务。您可以在任务管理页面,单击目标识别任务操作列的暂停或终止,停止识别任务的扫描。
自定义识别任务功能支持对指定资产使用已启用识别模板进行扫描。如果需要使用已启用模板(非主用)扫描指定数据库,您可以新建识别任务。
登录数据安全中心控制台。
在左侧导航栏,选择分类分级 > 任务管理。
在识别任务页签,单击新建识别任务。
在新增识别任务面板,配置识别任务配置项,并根据页面提示单击下一步,完成配置后单击确认。
配置项分类 | 配置项 | 描述 |
配置项分类 | 配置项 | 描述 |
基本信息 | 任务名称 | 输入任务名称。 |
启动时间 | 选择任务启动时间。可选项:
| |
作用域 | 选择识别任务扫描的范围。可选项:
| |
选择模板 | 选择扫描使用的识别模板。仅支持选择已启用识别模板,且最多只能选择两个识别模板。启用模板的具体操作,请参见使用识别模板。 | |
识别配置 | 结构化数据识别范围 | 选择结构化数据(例如RDS、PolarDB)的扫描范围。可选项:
|
非结构化数据识别配置 | 选择非结构化数据(OSS)的扫描范围和扫描深度。
| |
SLS数据识别配置 | 仅作用域资产范围包含非结构化数据(SLS),才显示并可设置SLS数据识别配置的资产范围和时间范围。
| |
其他配置 | 识别覆盖 | 设置检测到的敏感数据曾经被订正过时的处理方式。可选项:
|
任务备注 | 输入任务备注信息。 |
编辑:重新设置自定义识别任务,支持修改所有参数。
> 删除:删除多余的自定义识别任务。
如果识别模型进行了升级,或数据库内容发生了变化并且您希望尽快看到扫描结果,您可以执行重扫操作。重扫会对目标资产进行全量扫描。执行重扫操作后,扫描任务会立即被执行。建议您将扫描开始时间设置为数据资产调用低峰期的时段。
在执行重扫操作前,您需要确保相关识别模板为已启用状态。
自定义识别任务的启动时间为立即扫描,不支持执行重扫操作。
在识别任务页签,执行重扫操作:
重扫自定义识别任务:在任务列表中,单击目标自定义识别任务操作列的重扫。
重扫系统默认任务:单击系统默认任务,找到目标资产,单击操作列的重扫。
您可以在识别任务的扫描状态列,查看扫描进度。
暂停:如果您发现数据库业务存在异常,可以单击自定义识别任务操作列的暂停,暂时停止正在扫描的识别任务。
终止:终止当前和后续识别任务(支持自定义识别任务和系统默认任务)的执行。
订正功能可以对误标或漏标的敏感数据进行订正,以便企业对数据进行更加精准的管理和保护。数据安全中心提供了订正和恢复敏感数据识别模型的能力,您可以参考以下步骤操作。
登录数据安全中心控制台。
在左侧导航栏,选择分类分级 > 任务管理。
在任务管理页面,单击订正任务页签。
在左侧数据类型导航栏,单击需要订正的资产类型。
单击目标敏感数据操作列的订正或恢复,根据页面提示,修改订正后模型,然后单击确定。
执行恢复操作后,会恢复未订正前的识别模型。
DSC控制台中分类分级下资产透视页面,展示使用主用识别模板检测的最新敏感数据结果。具体内容,请参见查看敏感数据识别结果。
通过导出任务功能可以导出使用已启用识别模板(主用识别模板或活跃识别模板)检测出的敏感数据识别结果。您可以新建导出任务,DSC会获取任务中指定的识别模板检测的指定资产中的敏感数据识别结果供您下载。
导出任务中选择的识别模板和资产类型,必须已有对应的识别任务且已成功执行完成。否则,通过导出任务下载的敏感数据识别结果为空。
您可以参考以下内容创建导出任务并下载导出结果。
登录数据安全中心控制台。
在左侧导航栏,选择分类分级 > 任务管理。
在任务管理页面,单击导出任务页签。
在导出任务页签,单击新建导出任务。
配置导出任务,然后单击确定。
在基本信息区域,输入任务名称并选择识别任务使用的模板。
仅支持选择已启用模板。
在导出维度区域,选择资产类型或资产实例。
资产类型:选中需要导出的资产类型。
资产实例:选中需要导出的资产实例。
创建导出任务后,您可以在导出任务列表查看导出任务的状态。需要导出的数据量越大,导出需要的时间越长,请您耐心等待。
等待导出状态为已完成时,单击目标导出任务操作列的下载。
完成导出后,您需要在三天内下载导出的数据。超过三天导出任务会过期,您将无法下载导出的敏感数据。