公文校对 API
开发环境
开发环境
POST
https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45
接口说明
1.文字标点差错校对:错别字、词、多字错误、少字错误、语义重复、语序错误、句式杂糅、标点符号差错、量词和单位差错、数字差错、句子查重、序号检查。
2.知识性差错校对:重要讲话引用、姓名和职务信息、地理名词、机构名称、专有名词及术语、法律法规名称、常识差错、时政重点词、媒体报道禁用词和慎用词。
#接口Demo
公文校对API Demo python语言
#接口要求
内容 | 说明 |
---|---|
传输方式 | http[s] (为提高安全性,强烈推荐https) |
请求地址 | https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 |
Content-Type | application/json;charset=UTF-8 |
接口鉴权 | 签名机制,详情请参照下方接口鉴权 |
字符编码 | UTF-8 |
响应格式 | 统一采用JSON格式 |
开发语言 | 任意,只要可以向讯飞云服务发起HTTP请求的均可 |
适用范围 | 任意操作系统,但因不支持跨域不适用于浏览器 |
文本长度 | 不得超过220000个字符,汉字、英文字母、标点都算做一个字符 |
#接口鉴权
#1、鉴权参数列表
https://cn-huadong-1.xf-yun.com/v1/private/s37b42a45?authorization=YXBpX2tleT0iOTEyMDVhZmUwZDE3ZTM4YzYxYmUzNWZjYTM0NjUwM2MiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iejhVZWhEYmZ6K2N3QU9hdEJQV25iMHZYNTZnZml3MnZlcnZtdGgvTmI0ST0i&date=Mon%2C%2028%20Aug%202023%2010%3A05%3A35%20GMT&host=cn-huadong-1.xf-yun.com
参数名 | 类型 | 必传 | 描述 |
---|---|---|---|
host | String | 是 | 请求主机:cn-huadong-1.xf-yun.com |
date | String | 是 | 当前时间戳,RFC1123格式("EEE, dd MMM yyyy HH:mm:ss z") 示例:Mon, 28 Aug 2023 10:05:35 GMT |
authorization | String | 是 | 使用base64编码的签名相关信息(签名基于hamc-sha256计算) 具体参考下方详细生成规则 |
#2、第一步date生成规则
#3、第二步signature原始值示例(signature_origin)
host: cn-huadong-1.xf-yun.com
date: Mon, 28 Aug 2023 10:05:35 GMT
POST /v1/private/s37b42a45 HTTP/1.1
#4、第三步signature获取最终值
signature_sha=hmac-sha256(signature_origin,$apiSecret)
signature=base64(signature_sha)
基于第二步signature_origin、apiSecret以ff446b96b01252f80331ae6e4c64984a生成的最终结果示例:
z8UehDbfz+cwAOatBPWnb0vX56gfiw2vervmth/Nb4I=
#5、第四步authorization的base64前原始值示例(authorization_origin)
api_key="$api_key",algorithm="hmac-sha256",headers="host date request-line",signature="$signature"
#6、第五步authorization获取最终值
authorization = base64(authorization_origin)
基于authorization_origin进行base64生成的最终示例:
YXBpX2tleT0iOTEyMDVhZmUwZDE3ZTM4YzYxYmUzNWZjYTM0NjUwM2MiLCBhbGdvcml0aG09ImhtYWMtc2hhMjU2IiwgaGVhZGVycz0iaG9zdCBkYXRlIHJlcXVlc3QtbGluZSIsIHNpZ25hdHVyZT0iejhVZWhEYmZ6K2N3QU9hdEJQV25iMHZYNTZnZml3MnZlcnZtdGgvTmI0ST0i
{
"code": 200,
"msg": "success",
"data": {
"checklist": [
{
"wordHtml": "第二个百年目标",
"explanation": "推荐使用更常用的公文规范表述",
"type": {
"id": 8,
"belongId": 8,
"name": "时政重点词",
"desc": "时政重点词"
},
"word": "第二个百年目标",
"action": {
"id": 2
},
"htmlWords": [
{
"word": "第二个百年目标",
"position": 0
}
],
"suggest": [
"第二个百年奋斗目标"
],
"context": "第二个百年目标",
"position": 0,
"length": 7,
"source": 2,
"um_error_level": 1
}
]
},
"umeiTransactionId": "0e49fe88029aeb10"
}
参数名 | 类型 | 描述 |
---|---|---|
umeiTransactionId | string | 日志id |
code | int | 返回code码,200成功,其他失败 |
msg | string | 返回提示 |
data | object | 纠错数据 |
data.checklist | array | 纠错集合 |
data.checklist[n].wordHtml | string | 可能含有html的错误词 例如:蓝球 |
data.checklist[n].explanation | string | 解释说明 |
data.checklist[n].word | string | 错误词 |
data.checklist[n].context | string | 错词上下文 |
data.checklist[n].position | int | 错误词在文本中的开始位置 |
data.checklist[n].length | int | 错误词的长度 |
data.checklist[n].source | int | 无需关注,预留字段 |
data.checklist[n].type | object | 类型说明 |
data.checklist[n].type.id | int | 能力一级ID |
data.checklist[n].type.belongId | int | 能力归属ID |
data.checklist[n].type.name | string | 错误名称 |
data.checklist[n].type.desc | string | 错误描述 |
data.checklist[n].action | object | 纠错动作 |
data.checklist[n].action.id | int | 纠错具体动作: 1 标记 2 替换 4 删除 |
data.checklist[n].htmlWords | array | 错误词集合 |
data.checklist[n].htmlWords[n].word | string | 错误词 |
data.checklist[n].htmlWords[n].position | int | 错误词开始位置 |
data.checklist[n].suggest | array | 建议集合 |
data.checklist[n].suggest[n] | string | 具体建议详情 |
#3、错误能力ID对照表
错误能力ID(belongId) | 说明 |
---|---|
9 | 错别字、词 |
31 | 多字错误 |
32 | 少字错误 |
35 | 语义重复 |
34 | 语序错误 |
39 | 量和单位差错 |
36 | 数字差错 |
20 | 句式杂糅 |
21 | 标点符号差错 |
24 | 句子查重 |
119 | 重要讲话引用 |
101 | 姓名和职务信息 |
123 | 地理名词 |
19 | 机构名称 |
124 | 专有名词及术语 |
8 | 时政重点词 |
122 | 媒体报道禁用词和慎用词 |
240 | 法律法规名称 |
6 | 常识差错 |
105 | 涉国家统一、主权和领土完整 |
109 | 涉民族宗教 |
112 | 涉黄、暴、恐、赌、毒 |
111 | 涉低俗辱骂 |
108 | 涉违法违规 |
118 | 其他敏感内容 |
#常见问题
#公文校对与文本纠错、文本合规有哪些区别?
答:文本纠错主要偏向通用领域(如写作、出版)文本进行纠错,公文校对在公文写作使用等领域效果更佳,同时也适合通用领域。文本合规对各类场景风险拦截更全面。