科大讯飞
  1. 印刷文字识别(多语种)
科大讯飞
  • iOS SDK接入文档
  • 平台文档
    • 开发者新手指南
      • 平台简介
      • 快速指引
    • 服务协议
      • 讯飞开放平台用户服务协议
      • 讯飞星火认知大模型接口服务协议
      • 开发者应用创建规则
      • 讯飞开放平台隐私政策
      • 开发者用户个人信息保护合规指引
      • 开放平台SDK合规使用说明
      • SDK隐私政策总览
      • SDK合规使用说明总览
      • 科大讯飞儿童隐私保护政策
      • 讯飞开放平台SLA协议
      • 讯飞开放平台订购协议
    • 用户认证须知
      • 用户认证简介
      • 企业实名认证
      • 个人实名认证
      • 初创团队认证
      • 学生认证
      • 公益项目认证
      • 个人升级企业认证
    • 财务
      • 退款规则及退款流程
      • 财务相关说明
    • 账号
      • 账号注销与删除流程
      • 账号与应用说明
    • 会员
      • 会员权益详情
      • 会员时效说明
      • 会员试用版
  • 星火认知大模型
    • SparkDesk
      • SparkDesk使用指南
      • SparkDesk隐私政策
      • SparkDesk用户协议
    • 星火认知大模型
      • 服务说明
      • 通用鉴权URL生成说明
      • Spark Android SDK接入文档
      • Linux SDK接入文档
      • Windows SDK接入文档
      • 讯飞星火认知大模型隐私政策
      • Web 文档
        • 星火认知大模型Web API文档
        • 星火大模型V1.5
        • 星火大模型V2
        • 星火大模型V3
    • 星火知识库
      • 星火知识库 API 文档
        • 星火知识库 API 文档
        • 文档问答
        • 文档上传
        • 文档总结
        • 获取文档总结/概要信息
      • 新版Embedding API文档
    • 图片生成
      • 图片生成 API
    • 图片理解
      • 图片理解 API
    • 大模型定制训练平台
      • 产品使用说明
      • 星火微调服务Web API文档文档
        • 星火微调服务Web API文档文档
        • V1.5版本
        • 微调模型
  • 语音识别
    • 语音唤醒(新版)
    • 语音听写
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 音频文件格式说明
      • 语音听写服务说明
      • 语音听写(流式版)SDK隐私政策
      • 语音听写(流式版)SDK合规使用说明
      • HarmonyOS SDK 文档
      • 语音听写自训练平台
      • 语音听写(流式版)WebAPI
    • 语音转写
      • 语音转写服务说明
      • 语音转写 服务协议
      • WebAPI 文档
        • 语音转写 API 文档
        • 文件上传
        • 查询结果
    • 极速语音转写
      • 极速语音转写 API 文档
      • 小文件上传
      • 初始化分块信息
      • 分块上传
      • 分块上传完成
      • 创建任务
      • 查询任务
    • 实时语音转写
      • 实时语音转写服务说明
      • 实时语音转写 API
    • 离线语音听写
      • Android SDK 文档
      • 离线语音听写服务说明
      • 离线语音听写SDK隐私政策
      • 离线语音听写SDK合规使用说明
    • 离线语音听写(新版)
      • Android SDK 文档
      • 离线语音听写隐私政策
    • 语音唤醒
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音唤醒服务说明
      • 离线唤醒SDK隐私政策
    • 语音唤醒(新版)
      • Android SDK 文档
      • Linux SDK 文档
      • 语音唤醒隐私政策
    • 离线命令词识别
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 离线命令词识别服务说明
      • 离线命令词识别SDK隐私政策
      • 离线命令词SDK合规使用说明
  • 语音合成
    • 在线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 服务协议
      • 在线语音合成服务说明
      • 发音人自训练平台使用指南
      • WebAPI
    • 长文本语音合成
      • 长文本语音合成 API 文档
      • 创建任务
      • 查询任务
    • 离线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 服务协议
      • 离线语音合成服务说明
    • AI虚拟人技术
      • Web SDK 2.0 接入指南
      • Android-SDK
      • iOS-SDK
      • Web API 文档
        • AI虚拟人技术 API 文档
        • 音频驱动
        • 启动
        • 文本驱动
        • 停止
        • 心跳
  • 语音扩展
    • 语音评测(流式版)
      • 接口说明
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音评测SDK隐私政策
      • 语音评测(流式版)API
    • 语音评测suntone
      • 语音评测suntone API
    • 离线变声
      • Android SDK 集成文档
    • 音色转换
      • 音色转换 API
    • 性别年龄识别
      • 性别能力识别 API
    • 声纹识别
      • Web API 文档
      • 声纹识别 API
    • 歌曲识别
      • 歌曲识别 API
    • 歌曲识别 ACRCloud
      • 接口说明
      • 哼唱识别
      • 音乐识别
    • AI 客服中间件
      • 接口说明
      • 获取token
      • 查询配置
      • 直接外呼
      • 创建外呼任务
      • 提交任务数据
      • 启动外呼任务
      • 暂停外呼任务
      • 删除外呼任务
      • 查询任务
      • 结果数据推送
      • 话单推送
      • 录音推送
      • 会话推送
      • 呼入话术上下文动态数据获取
  • 自然语言处理
    • 文本纠错
      • 文本纠错 API
      • 黑白名单上传
    • 公文校队
      • 公文校对 API
    • 文本合规
      • 文本合规 API
      • 新增黑名单词库
      • 根据lib_id添加黑名单词条
      • 根据lib_id查询词条明细
      • 根据lib_id删除词条
      • 根据appid查询账户下所有词库
      • 根据lib_id删除词库
      • 创建白名单库
      • 根据lib_id添加放行词条
      • 根据lib_id查询词条详情
      • 根据lib_id删除词条信息
      • 根据appid查询所有词库列表
      • 根据lib_id删除词库
    • 图片合规
      • 图片合规 API
    • 音频合规
      • 音频合规 API
    • 视频合规
      • 视频合规 API
    • 文本改写
      • 文本改写 API
    • 机器翻译
      • 机器翻译(新) API
    • 机器翻译niutrans
      • 机器翻译niutrans API
    • 同声传译
      • 同声传译 API 
    • 离线分词
      • Android SDK 文档
  • 人脸识别
    • 人脸验证与检索
      • Android SDK 文档
      • iOS SDK 文档
      • 人脸验证与检索SDK隐私政策
      • 人脸验证与检索SDK合规使用说明
    • 人脸对比
      • 人脸比对 API
    • 人脸比对sensetime
      • 人脸比对sensetime API
    • 人脸水印照比对
      • 人脸水印照比对 API
    • 静默活体检测
      • 静默活体检测 API
    • 配合式活体检测
      • 配合式活体检测 API
    • 静默活体检测sensetime
      • 静默活体检测sensetime API
    • 人脸检测和属性分析
      • 人脸检测和属性分析 API
    • 人脸特征分析tuputech
      • 年龄 API
      • 颜值 API
      • 性别 API
      • 表情 API
  • 文字识别
    • 通用文字识别
      • 通用文字识别 API
    • 通用文字识别
      • 通用文字识别 intsig API
    • 手写文字识别
      • 手写文字识别 API
    • 印刷文字识别
      • 印刷文字识别 API
    • 印刷文字识别(多语种)
      • 印刷文字识别(多语种)
        POST
    • 印刷文字识别(多语种)intsig
      • 印刷文字识别(多语种)intsig API
    • 图片文档还原
      • 图片文档还原 API 
    • 国内通用票据识别
      • 接口说明
      • 国内通用票据识别 API
    • 离线OCR
      • Android SDK 文档
    • 名片识别 intsig
      • 名片识别 API
    • 身份证识别 intsig
      • 身份证识别 intsig API
    • 银行卡识别 intsig
      • 银行卡识别 API
    • 营业执照识别 intsig
      • 营业执照识别 intsig API
    • 增值税发票识别 intsig
      • 增值税发票识别 intsig API
    • 拍照速算识别
      • 接口说明
      • 拍照速算识别 API
    • 公式识别
      • 接口说明
      • 公式识别 API
    • 指尖文字识别
      • 接口说明
      • 指尖文字识别 API
    • 身份证识别
      • 接口说明
      • 身份证识别 API
    • 增值税发票识别
      • 接口说明
      • 增值税发票识别 API
    • 营业执照识别
      • 接口说明
      • 营业执照识别 API
    • 火车票识别
      • 接口说明
      • 火车票识别 API
    • 出租车发票识别
      • 接口说明
      • 出租车发票识别 API
  • 图像识别
    • 场景识别
      • 场景识别 API
    • 物体识别
      • 物体识别 API
    • 场所识别
      • 场所识别 API 文档
  • 基础服务
    • 云服务器 CVM
      • 云服务器 CVM 产品简介
      • 快速入门
      • 服务协议
  • 解决方案
    • 签到解决方案
      • SaaS操作文档
    • 智能硬件通用方案
      • 智能硬件通用方案说明
      • 麦克风阵列Android SDK
      • 麦克风阵列Linux SDK
      • 双麦阵列设计参考
      • 麦克风阵列录音要求
      • 语音唤醒Android SDK
      • 语音唤醒Linux SDK
      • 离线声纹Android SDK
      • 离线声纹Linux SDK
  • MSC API 文档
    • Android
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • Android 常量字段值
      • 基础类
    • IOS
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • 基础类
    • Windows&Linux
      • 文件列表
      • API 文档
    • Java
      • 所有类列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 常量字段值
      • 基础类
  1. 印刷文字识别(多语种)

印刷文字识别(多语种)

开发环境
http://dev-cn.your-api-server.com
开发环境
http://dev-cn.your-api-server.com
POST
http(s): //cn-east-1.api.xf-yun.com/v1/ocr

接口说明#

基于深度神经网络模型的端到端文字识别系统和讯飞自研的行业先进的光学字符识别技术,将图片(来源如扫描仪或数码相机)中的印刷字体,支持扫描体以及复杂自然场景下的文字识别,直接转换为可编辑文本。支持标准协议中英、保加利亚、塞尔维亚、乌克兰、波斯、普什图、乌尔都、希伯来、立陶宛、挪威、斯洛伐克、塔吉克、土库曼、斯洛文尼亚、荷兰、波兰、孟加拉、捷克、菲律宾、克罗地亚、豪撒、匈牙利、罗马尼亚、瑞典、斯瓦西里、土耳其、乌兹别克、格鲁吉亚、阿塞拜疆、丹麦、芬兰、拉脱维亚、希腊、亚美尼亚、老挝、泰米尔、泰卢固语、德语、法语、西班牙语、葡萄牙语、意大利语、马来语、印尼语、日语、韩语、俄语、越南语、哈萨克语种识别。实现高精准、毫秒级识别体验。适用于资料存档/处理,辅助教学,卡证信息提取。
部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
印刷文字识别(多语种) demo java语言
印刷文字识别(多语种) demo python语言
印刷文字识别(多语种)时,需按照以下要求:
内容说明
传输方式http[s] (为提高安全性,强烈推荐https)
请求地址http(s): //cn-east-1.api.xf-yun.com/v1/ocr 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用
请求行POST /v1/ocr HTTP/1.1
接口鉴权签名机制,详情请参照下方鉴权说明
字符编码UTF-8
响应格式统一采用JSON格式
开发语言任意,只要可以向讯飞云服务发起HTTP请求的均可
适用范围任意操作系统,但因不支持跨域不适用于浏览器
图片格式jpg, jpeg, png, bmp, webp, tiff
图片大小最小尺寸:1B, 最大尺寸:10485760B

#鉴权说明#

在调用业务接口时,请求方需要对请求进行签名,服务端通过签名来校验请求的合法性。

#鉴权方法#

通过在请求地址后面加上鉴权相关参数的方式,请注意影响鉴权结果的值有url、apiSecret、apiKey、date,如果调试鉴权,请务必按照示例中给的值进行调试,具体参数如下:
http示例url:
https://cn-east-1.api.xf-yun.com/v1/ocr?host=cn-east-1.api.xf-yun.com&date=Wed%2C+07+Dec+2022+08%3A18%3A43+GMT&authorization=YXBpX2tleT0iYTc0NjZkNmY1YTA5OWQzZWQzOTRiM2Y1OTc0NmNlZGIiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0icDdKU3pQUzR3N0NWYndweEprQlBmSk1ueENheTlvbVh0Y1l1SHdhSS9DWT0i
鉴权参数:
参数类型必须说明示例
hoststring是请求主机cn-east-1.api.xf-yun.com
datestring是当前时间戳,RFC1123格式("EEE, dd MMM yyyy HH:mm:ss z")Wed, 07 Dec 2022 08:18:43 GMT
authorizationstring是使用base64编码的签名相关信息(签名基于hamc-sha256计算)参考下方详细生成规则
• date参数生成规则:
date必须是UTC+0或GMT时区,RFC1123格式(Wed, 07 Dec 2022 08:18:43 GMT)。
服务端会对date进行时钟偏移检查,最大允许300秒的偏差,超出偏差的请求都将被拒绝。
• authorization参数生成格式:
1)获取接口密钥APIKey 和 APISecret。
在讯飞开放平台控制台,创建一个应用后打开印刷文字识别(多语种)页面可以获取,均为32位字符串。
2)参数authorization base64编码前(authorization_origin)的格式如下。
api_key="$api_key",algorithm="hmac-sha256",headers="host date request-line",signature="$signature"
其中 api_key 是在控制台获取的APIKey,algorithm 是加密算法(仅支持hmac-sha256),headers 是参与签名的参数(见下方注释)。
signature 是使用加密算法对参与签名的参数签名后并使用base64编码的字符串,详见下方。
*注:* headers是参与签名的参数,请注意是固定的参数名("host date request-line"),而非这些参数的值。
3)signature的原始字段(signature_origin)规则如下。
signature原始字段由 host,date,request-line三个参数按照格式拼接成,
拼接的格式为(\n为换行符,’:’后面有一个空格):
host: $host\ndate: $date\n$request-line
假设
请求url = "https://cn-east-1.api.xf-yun.com/v1/ocr"
date = "Wed, 07 Dec 2022 08:18:43 GMT"
那么 signature原始字段(signature_origin)则为:
host: cn-east-1.api.xf-yun.com
date: Wed, 07 Dec 2022 08:18:43 GMT
POST /v1/ocr HTTP/1.1
4)使用hmac-sha256算法结合apiSecret对signature_origin签名,获得签名后的摘要signature_sha。
signature_sha=hmac-sha256(signature_origin,$apiSecret)
其中 apiSecret 是在控制台获取的APISecret
5)使用base64编码对signature_sha进行编码获得最终的signature。
signature=base64(signature_sha)
假设
APISecret = "apisecretXXXXXXXXXXXXXXXXXXXXXXX"	
date = "Wed, 07 Dec 2022 08:18:43 GMT"
则signature为
signature="p7JSzPS4w7CVbwpxJkBPfJMnxCay9omXtcYuHwaI/CY="
6)根据以上信息拼接authorization base64编码前(authorization_origin)的字符串,示例如下。
api_key="apikeyXXXXXXXXXXXXXXXXXXXXXXXXXX", algorithm="hmac-sha256", headers="host date request-line", signature="p7JSzPS4w7CVbwpxJkBPfJMnxCay9omXtcYuHwaI/CY="
注: headers是参与签名的参数,请注意是固定的参数名("host date request-line"),而非这些参数的值。
7)最后再对authorization_origin进行base64编码获得最终的authorization参数。
authorization = base64(authorization_origin)
示例结果为:
authorization=YXBpX2tleT0iYTc0NjZkNmY1YTA5OWQzZWQzOTRiM2Y1OTc0NmNlZGIiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0icDdKU3pQUzR3N0NWYndweEprQlBmSk1ueENheTlvbVh0Y1l1SHdhSS9DWT0i

#鉴权结果#

如果鉴权失败,则根据不同错误类型返回不同HTTP Code状态码,同时携带错误描述信息,详细错误说明如下:
HTTP Code说明错误描述信息解决方法
401缺少authorization参数{"message":"Unauthorized"}检查是否有authorization参数,详情见authorization参数详细生成规则
401签名参数解析失败{“message”:”HMAC signature cannot be verified”}检查签名的各个参数是否有缺失是否正确,特别确认下复制的api_key是否正确
401签名校验失败{“message”:”HMAC signature does not match”}签名验证失败,可能原因有很多。 1. 检查api_key,api_secret 是否正确。 2.检查计算签名的参数host,date,request-line是否按照协议要求拼接。 3. 检查signature签名的base64长度是否正常(正常44个字节)。
403时钟偏移校验失败{“message”:”HMAC signature cannot be verified, a valid date or x-date header is required for HMAC Authentication”}检查服务器时间是否标准,相差5分钟以上会报此错误
时钟偏移校验失败示例:
HTTP/1.1 403 Forbidden
Date: Mon, 30 Nov 2020 02:34:33 GMT
Content-Length: 116
Content-Type: text/plain; charset=utf-8
{
    "message": "HMAC signature does not match, a valid date or x-date header is required for HMAC Authentication"
}
text字段Base64解码后示例:
{
   "category" : "mix6",
   "pages" : [
      {
         "angle" : 359.08724975585938,
         "exception" : 0,
         "height" : 326,
         "lines" : [
            {
               "angle" : 0,
               "conf" : 0.98804998397827148,
               "content" : "荷兰语",
               "coord" : [
                  {
                     "x" : 75,
                     "y" : 46
                  },
                  {
                     "x" : 140,
                     "y" : 46
                  },
                  {
                     "x" : 140,
                     "y" : 72
                  },
                  {
                     "x" : 75,
                     "y" : 72
                  }
               ],
               "exception" : 0,
               "words" : [
                  {
                     "conf" : "1.0",
                     "content" : "荷兰语",
                     "coord" : [
                        {
                           "x" : 75,
                           "y" : 46
                        },
                        {
                           "x" : 139,
                           "y" : 46
                        },
                        {
                           "x" : 139,
                           "y" : 73
                        },
                        {
                           "x" : 75,
                           "y" : 73
                        }
                     ]
                  }
               ]
            },
            {
               "angle" : 0.5509040355682373,
               "conf" : 0.9999803900718689,
               "content" : "Hallo, hoe is het weer",
               "coord" : [
                  {
                     "x" : 44,
                     "y" : 120
                  },
                  {
                     "x" : 328,
                     "y" : 117
                  },
                  {
                     "x" : 328,
                     "y" : 150
                  },
                  {
                     "x" : 44,
                     "y" : 153
                  }
               ],
               "exception" : 0,
               "words" : [
                  {
                     "conf" : "1.0",
                     "content" : "Hallo,",
                     "coord" : [
                        {
                           "x" : 43,
                           "y" : 120
                        },
                        {
                           "x" : 114,
                           "y" : 119
                        },
                        {
                           "x" : 115,
                           "y" : 153
                        },
                        {
                           "x" : 44,
                           "y" : 153
                        }
                     ]
                  },
                  {
                     "conf" : "1.0",
                     "content" : "hoe",
                     "coord" : [
                        {
                           "x" : 129,
                           "y" : 119
                        },
                        {
                           "x" : 164,
                           "y" : 118
                        },
                        {
                           "x" : 165,
                           "y" : 152
                        },
                        {
                           "x" : 130,
                           "y" : 152
                        }
                     ]
                  },
                  {
                     "conf" : "1.0",
                     "content" : "is",
                     "coord" : [
                        {
                           "x" : 183,
                           "y" : 118
                        },
                        {
                           "x" : 196,
                           "y" : 118
                        },
                        {
                           "x" : 197,
                           "y" : 152
                        },
                        {
                           "x" : 184,
                           "y" : 152
                        }
                     ]
                  },
                  {
                     "conf" : "1.0",
                     "content" : "het",
                     "coord" : [
                        {
                           "x" : 210,
                           "y" : 118
                        },
                        {
                           "x" : 245,
                           "y" : 118
                        },
                        {
                           "x" : 246,
                           "y" : 151
                        },
                        {
                           "x" : 211,
                           "y" : 152
                        }
                     ]
                  },
                  {
                     "conf" : "1.0",
                     "content" : "weer",
                     "coord" : [
                        {
                           "x" : 260,
                           "y" : 117
                        },
                        {
                           "x" : 326,
                           "y" : 117
                        },
                        {
                           "x" : 327,
                           "y" : 151
                        },
                        {
                           "x" : 261,
                           "y" : 151
                        }
                     ]
                  }
               ]
            },
            {
               "angle" : 356.71075439453125,
               "conf" : 0.99095529317855835,
               "content" : "vandaag",
               "coord" : [
                  {
                     "x" : 44,
                     "y" : 154
                  },
                  {
                     "x" : 158,
                     "y" : 160
                  },
                  {
                     "x" : 156,
                     "y" : 192
                  },
                  {
                     "x" : 42,
                     "y" : 186
                  }
               ],
               "exception" : 0,
               "words" : [
                  {
                     "conf" : "1.0",
                     "content" : "vandaag",
                     "coord" : [
                        {
                           "x" : 43,
                           "y" : 153
                        },
                        {
                           "x" : 156,
                           "y" : 160
                        },
                        {
                           "x" : 154,
                           "y" : 193
                        },
                        {
                           "x" : 41,
                           "y" : 186
                        }
                     ]
                  }
               ]
            }
         ],
         "width" : 491
      }
   ],
   "protoc" : "2.0",
   "version" : "4.5.0.1120"
}
payload.ocr_output_text.text字段base64解码后信息如下,请重点关注:
参数名类型描述
versionstring引擎版本号
categorystring引擎调用模式
protocolstring输出协议版本号,当前协议版本号为2.0
pagesarray页面集合
pages.heightint页面的高度,以像素为单位
pages.widthint页面的宽度,以像素为单位
pages.exceptionint异常信息,0(正常)、-1(异常)
pages.anglefloat旋转角度,范围[0,360],顺时针方向
pages.linesarray文本行,若未检测到,则该字段不存在
pages.tablesarray表格,若未检测到,则该字段不存在
pages.checkboxesarray复选框,若未检测到,则该字段不存在
pages.sealsarray印章,若未检测到,则该字段不存在
pages.fingerprintsarray指印区,若未检测到,则该字段不存在
pages.graphsarray插图,若未检测到,则该字段不存在
pages.headersarray页眉,若未检测到,则该字段不存在
pages.footersarray页脚,若未检测,则该字段不存在
pages.blocksarray段落,若未检测到文本行或未开启分块功能,则该字段不存在。在简历、合同文档结构化中默认按照blocks的结构进行输出
pages.page_numbersarray页码,若未检测到,则该字段不存在
pages.expressionsarray公式,若未检测到,则该字段不存在
pages.barcodesarray条码,若未检测到,则该字段不存在
pages.lines字段
参数名类型描述
idint文本行编号,取值范围大于等于0的整数
coordarray位置坐标,至少4个点
coord.xint坐标轴x
coord.yint坐标轴y
anglefloat文本行角度,取值范围[0-360]度
conffloat置信度,取值范围[0-1]
typestring文本行数据类型(handwriting手写、print印刷)
exceptionint异常信息(0:正常,-1:异常返回)
contentstring识别结果
wordsarray单词集合
words.contentstring识别结果
words.conffloat置信度,取值范围[0-1]
words.coordarray位置坐标,至少4点
words.coord.xint坐标轴x
words.coord.yint坐标轴y
word_unitsarray单字集合(中文单字,英文单个字母)
word_units.contentstring识别结果
word_units.conffloat置信度,取值范围[0-1]
word_units.coordarray位置坐标,至少4点
word_units.coord.xint坐标轴x
word_units.coord.yint坐标轴y
pages.tables字段
参数名类型描述
idint表格编号,若id相同则说明同属于一个表格
coordarray位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
colsint表格划分出的列数
rowsint表格划分出的行数
height_setarray表格单元格高度的集合,以像素为单位
width_setarray表格单元格宽度的集合,以像素为单位
cellsarray单元格的集合
cells.coordarray位置坐标,至少四点
cells.coord.xint坐标轴x
cells.coord.yint坐标轴y
cells.colint单元格的列号
cells.rowint单元格的行号
cells.colspanint单元格横跨的列数
cells.rowspanint单元格横跨的行数
cells.linesarray协议2.0不推荐使用
cells.elementsarray单元格中插入要素的集合
cells.elements.idint单元格中插入要素的编号
cells.elements.typestring单元格中插入其他要素的类型(table表格、graph插图、checkbox复选框、seal印章、fingerprint指印、block段落)
pages.checkboxes字段
参数名类型描述
idint复选框编号
coordobject位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴x
typestringtick: 勾选(涂黑)框 cross: 叉选框 blank: 空白框
pages.seals字段
参数名类型描述
idint印章编号
coordarray目标区域位置信息,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
elementsarray印章中插入要素的集合
elements.idint印章中插入要素的编号
elements.typestring印章中插入要素的类型,table(表格)、graph( 插图)、 checkbox(复选框)、seal(印章)、fingerprint(指印)、 block(段落)
pages.fingerprints字段
参数名类型描述
idint指印编号
coordobject位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
pages.graphs字段
参数名类型描述
idint插图中插入要素的编号
coordarray位置信息,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
elementsarray插图中插入要素的集合
elements.idfloat默认值:1
elements.typestring插图中插入要素的类型,可选值:block(段落)
pages.headers字段
参数名类型描述
idint页眉编号
coordarray目标区域位置信息,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
elementsarray页眉中插入要素的集合
elements.idint页眉中插入要素的编号
elements.typestring页眉中插入要素的类型,table(表格)、graph(插图)、checkbox( 复选框)、seal(印章)、fingerprint(指印)、block(段落)
pages.footers字段
参数名类型描述
idint页脚编号
coordarray位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
elementsarray页脚中插入要素的集合,取值范围:min: 10 ~ max: 100
elements.idint插入要素编号
elements.typestring页脚中插入要素的类型,table(表格)、graph(插图)、checkbox(复选框)、seal(印章)、fingerprint(指印)、block(段落)
pages.blocks字段
参数名类型描述
idint段落编号,对于跨栏,跨页的文本块区域,其编号是相同的
coordarray位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
line_idsarray段落中的文本行,采用lines中的id进行索引
line_ids.levelint层级:目前只在简历、文档结构化中出现。表示当前块在该份简历中所属的嵌套层数。取值范围大于等于1的整数。
line_ids.parent_idint父节点:目前只在简历、文档结构化中出现。当前块所对应的父节点。取值范围大于等于-1的整数
line_ids.typestring段落块的类别(目前只在简历、文档结构化中出现) head: 标题 line: 文本
pages.page_numbers字段
参数名类型描述
idint页码编号
coordarray目标区域位置信息,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
elementsarray页码中插入要素的集合
elements.idint页码中插入要素的编号
elements.typestring页码中插入要素的类型
pages.expressions字段
参数名类型描述
idint公式编号
coordarray目标区域位置信息,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
pages.barcodes字段
参数名类型描述
idint条码编号
coordarray位置坐标,至少4点
coord.xint坐标轴x
coord.yint坐标轴y
typestring条码类型,barcode(条形码)、qrcode(二维码)
contentstring识别结,默认值:1

#language语言特性参数列表:#

语言参数
荷兰af
阿塞拜疆az
保加利亚bg
孟加拉bn
中英ch_en
捷克cs
丹麦da
德语de
希腊el
西班牙语es
波斯fa
芬兰fi
法语fr
豪撒ha
希伯来he
克罗地亚hr
匈牙利hu
亚美尼亚hy
印尼语id
意大利语it
日语ja
格鲁吉亚ka
哈萨克语kka
韩语ko
老挝lo
立陶宛lt
拉脱维亚lv
内蒙语mn
马来语ms
挪威nb
波兰pl
普什图ps
葡萄牙语pt
罗马尼亚ro
俄语ru
斯洛伐克sk
斯洛文尼亚sl
塞尔维亚sr
瑞典sv
斯瓦西里sw
泰米尔ta
泰卢固te
塔吉克tg
土库曼tk
菲律宾tl
土耳其tr
维吾尔语ug
乌克兰uk
乌尔都ur
乌兹别克uz
越南语vi
印地语hi
泰语th

#常见问题#

#印刷文字识别(多语种)的主要功能是什么?#

答:将图片中印刷的文字转化为计算机可编码的文字。

#印刷文字识别(多语种)支持什么应用平台?#

答:目前支持Web API应用平台。

#印刷文字识别(多语种)对图片有什么要求吗?#

答:图片格式支持 jpg, jpeg, png, bmp, webp, tiff 格式,且需保证图像文件大小base64编码后不超过4MB。
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'http://dev-cn.your-api-server.comhttp(s): //cn-east-1.api.xf-yun.com/v1/ocr' \
--header 'Content-Type: application/json' \
--data-raw '{
	"header": {
		"app_id": "your appid",
		"status": 3
	},
	"parameter": {
		"ocr": {
			"language": "af",
			"ocr_output_text": {
				"encoding": "utf8",
				"compress": "raw",
				"format": "json"
			}
		}
	},
	"payload": {
		"image": {
			"encoding": "jpg",
			"image": "iVBORw0KGg······",
			"status": 3
		}
	}
}'
响应示例响应示例
{
  "header": {
    "code": 0,
    "message": "string",
    "sid": "string"
  },
  "payload": {
    "ocr_output_text": {
      "compress": "string",
      "encoding": "string",
      "format": "string",
      "seq": "string",
      "status": "string",
      "text": "string"
    }
  }
}

请求参数

Body 参数application/json
header
object 
用于上传平台参数
必需
app_id
string 
必需
在讯飞开放平台申请的appid信息
status
integer 
必需
请求状态,取值为:3(一次传完)
parameter
object 
必需
用于上传服务特性参数
ocr
object 
服务别名
必需
payload
object 
必需
用于上传服务特性参数
image
object 
输入数据
必需
示例

返回响应

🟢200成功
application/json
Body
header
object 
必需
用于描述平台特性的参数
code
integer 
必需
0表示会话调用成功(并不一定表示服务调用成功,服务是否调用成功以text字段为准)
message
string 
描述信息
必需
sid
string 
必需
本次会话唯一标识id
payload
object 
必需
数据段,用于携带响应的数据
ocr_output_text
object 
响应数据块
必需
上一页
印刷文字识别 API
下一页
印刷文字识别(多语种)intsig API
Built with