全部产品
Search
文档中心

智能媒体管理:DetectImageTexts - 图片文本识别

更新时间:Dec 11, 2024

图片文本识别,将图片上的文字内容智能识别成为可编辑的文本。

接口说明

  • 请确保在使用该接口前,已充分了解智能媒体管理产品的收费方式和价格
  • 图片大小不超过 20M。
  • 图片最短边不小于 20px,最长边不超过 30,000px。
  • 图片的纵横比小于 1:2。
  • 图片文字不建议小于 15px*15px(如果小于,则识别率较低)。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
imm:DetectImageTextsnone
*Project
acs:imm:{#regionId}:{#accountId}:project/{#ProjectName}

请求参数

名称类型必填描述示例值
ProjectNamestring

项目名称,获取方式请参见创建项目

test-project
SourceURIstring

文件的存储位置。

OSS 地址规则为 oss://${Bucket}/${Object},其中${Bucket}为和当前项目处于同一区域(Region)的 OSS Bucket 名称,${Object}为包含文件扩展名的文件完整路径。

oss://test-bucket/test-object.jpg
CredentialConfigCredentialConfig

如无特殊需求,请保持留空即可。

链式授权配置,非必填。更多信息,请参见使用链式授权访问其他实体资源

返回参数

名称类型描述示例值
object

图片文本识别结果。

RequestIdstring

请求唯一 ID。

1B3D5E0A-D8B8-4DA0-8127-ED32C851****
OCRTextsstring

OCR 文本全文,由 OCRContents 拼接而成。

智能媒体管理。
OCRContentsarray

OCR 文本片段列表。

OCRContentsOCRContents

识别出来的图片中的文字块列表,每个元素包含一个文字块的内容、位置等信息。

示例

正常返回示例

JSON格式

{
  "RequestId": "1B3D5E0A-D8B8-4DA0-8127-ED32C851****",
  "OCRTexts": "智能媒体管理。",
  "OCRContents": [
    {
      "Language": "zh-hans",
      "Contents": "欢迎使用智能媒体管理",
      "Confidence": 0.8254936695098877,
      "Boundary": {
        "Width": 200,
        "Height": 300,
        "Left": 10,
        "Top": 30,
        "Polygon": [
          {
            "X": 10,
            "Y": 10
          }
        ]
      }
    }
  ]
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
暂无变更历史