全部产品
Search
文档中心

智能开放搜索 OpenSearch:清理文档

更新时间:Sep 27, 2023

开放搜索已提供“清理过期文档”功能。可以通过在控制台实现,手动清空应用文档、手动清理过期文档、自动清理过期文档等需求。

注意:

  • 清空数据、清理文档等功能,都会触发索引重建。

  • 清理文档功能,只能清理主表中符合条件的过期文档。

  • 同时存在线上应用和线下应用时,需删除线下应用才可以使用“立即清理”功能。

  • “立即清理”是“自动清理”的立即执行,“立即清理”开始后会生成一个线下应用清理主表中符合条件的过期文档,任务完成后线下应用会自动切换到线上;

  • “定时清理文档”任务默认是在凌晨(00:00)开始执行,开始后会生成一个线下应用清理主表中符合条件的过期文档,任务完成后线下应用会自动切换到线上;

操作步骤

进入开放搜索“应用管理”页,展开“更多”,点击“清理文档”按钮,选择“立即清理”或“自动清理”

image

立即清理

  • 保留字段:必须为主表中的 INT 字段类型,该字段值为“秒级”或“毫秒级” unix 时间戳值。

  • 在最近X天内的文档:这里的 X 表示需保留最近多少天内的文档,值域 [ 7-180 ]。

  • 该字段值单位为

    • 秒: 秒级 unix 时间戳一般为10位整数。

    • 毫秒: 毫秒级 unix 时间戳一般为13位整数(数据源中datetime类型,OpenSearch将转为以毫秒为单位)。

2

注意

  • 保留字段只能是主表中的 INT 字段类型。

自动清理

  • 每天自动清理文档:表示是否开启自动清理过期文档功能(默认关闭)。

  • 保留字段:必须为主表中的 INT 字段类型,该字段值为“秒级”或“毫秒级” unix 时间戳值。

  • 在最近X天内的文档:这里的 X 表示需保留最近多少天内的文档,值域 [ 7-180 ]。

  • 该字段值单位为

    • 秒: 秒级 unix 时间戳一般为10位整数。

    • 毫秒: 毫秒级 unix 时间戳一般为13位整数(数据源中datetime类型,OpenSearch将转为以毫秒为单位)。

3

注意:

自动过期清理将每天清除您选择的字段中符合过期条件的文档,更新频率较低时不建议使用该功能。