语音转写 API 文档
接口说明
语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。
转写的是已录制音频(非实时),音频文件上传成功后进入等待队列,待转写成功后用户即可获取结果,返回结果时间受音频时长以及排队任务量的影响。 如遇转写耗时比平时延长,大概率表示当前时间段出现转写高峰,请耐心等待即可,我们承诺有效任务耗时最大不超过5小时,详情请参考SLA协议 。
另外,为使转写服务更加通畅,请尽量转写5分钟以上的音频文件,上传大量的短音频易引起网络和服务器资源紧张,从而导致任务排队积压。
音频时长与理论返回时间可以参考下表(请注意,实际返回时长受上传的音频时长和任务总量影响,忙时会出现任务排队情况):
音频时长X(分钟) | 参考返回时间Y(分钟) |
---|---|
X<10 | Y<3 |
10<=X<30 | 3<=Y<6 |
30<=X<60 | 6<=Y<10 |
60<=X | 10<=Y<20 |
- 接口Demo: 部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
语音转写demo java语言
语音转写demo python语言 - 有奖调研 诚邀您参与我们转写服务有奖调研,参与问卷即有机会获取超长服务包
#接口要求
内容 | 说明 |
---|---|
请求协议 | http[s](为提高安全性,强烈推荐https) |
请求地址 | 1、文件上传:http[s]: //raasr.xfyun.cn/v2/api/upload 2、获取结果:http[s]: //raasr.xfyun.cn/v2/api/getResult 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 |
请求方式 | POST |
接口鉴权 | 签名机制,详见下方signa生成 |
字符编码 | UTF-8 |
响应格式 | 统一采用JSON格式 |
开发语言 | 任意,只要可以向讯飞云服务发起HTTP请求的均可 |
音频属性 | 采样率16k或8k、位长8bit或16bit、单声道&多声道 |
音频格式 | mp3,wav,pcm,aac,opus,flac,ogg,m4a,amr,speex(微信),lyb,ac3,aac,ape,m4r,mp4,acc,wma |
音频大小 | 不超过500M |
音频时长 | 不超过5小时,建议5分钟以上 |
语言种类 | 中文普通话、英文,小语种以及中文方言可以到控制台-语音转写-方言/语种处添加试用或购买 |
转写结果保存时长 | 已完成订单(包含成功和失败)会在识别完成 72 小时后删除,即无法再被查到结果 |
获取结果次数 | 不得超过100次 |
SLA保障时长 | 返回时长最大不超过5小时,赔偿标准等详情请参考SLA协议 |
语种支持
语种名称 | 语种编码 |
---|---|
中文 | cn |
英文 | en |
日语 | ja |
韩语 | ko |
俄语 | ru |
法语 | fr |
西班牙语 | es |
越南语 | vi |
粤语 | cn_cantonese |
维吾尔语 | cn_uyghur |
藏语 | cn_tibetan |
阿拉伯语 | ar |
德语 | de |
意大利语 | it |
#错误码
错误码 | 描述 |
---|---|
100001 | 订单不存在或状态异常 |
100002 | 订单音频未上传 |
100003 | 参数错误 |
100004 | 查询订单错误 |
100005 | 查询音频为空 |
100006 | 上传音频异常 |
100007 | 权限错误 |
100008 | 签名异常-请求时间超过限制 |
100009 | 签名校验不通过 |
100012 | 请求超过频率限制 |
100013 | 订单未完成 |
100015 | 热词必须是中文 |
100016 | 热词超出长度限制 |
100017 | 热词超出数量限制 |
100018 | 热词分隔符不能连续出现 |
100019 | 热词验证失败 |
100020 | 语言验证失败 |
100021 | 热词上传失败 |
100022 | 热词不断重复 |
100023 | 热词保存失败 |
100024 | 热词为空 |
100025 | 热词 ID 未知 |
100026 | 时间格式必须为:yy-MM-dd |
100027 | patch ID 未知 |
100028 | Patch 验证失败 |
100029 | 文件已存在 |
100030 | 未知的文件格式 |
100031 | 多候选 ID 未知 |
100032 | 多候选验证失败 |
100033 | 无效的角色分离个数,角色分离个数范围:[0-10] |
100034 | 更改 AccesskeySecret 失败 |
100037 | 非法的订单号 |
100038 | 删除订单验证失败 |
100039 | 订单为空 |
100040 | 订单个数超出限制 |
100042 | 外链地址无效 |
100041 | 切换通道失败 |
100043 | 通道类型验证失败 |
100044 | 通道类型不存在 |
#常见问题
有奖调研 诚邀您参与我们转写服务有奖调研,参与问卷即有机会获取超长服务包
#语音转写支持哪些音频格式?
答:目前语音转写支持的音频格式为:已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道,支持语种:中文普通话、英语、开通的小语种以及中文方言,采样率:8KHz,16KHz
#语音转写支不支持并发?
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。
#语音转写可以试用吗?
答:可以领取新用户礼包,根据您认证的程度,提供最多50小时的免费时长,有效期为一年。
#语音转写支持什么语言?
答:支持语种:中文普通话、英语,小语种以及中文方言可以到控制台-语音转写-方言/语种处添加试用或购买;设置方式参考上述语言参数切换即可
#语音转写的套餐扣费顺序是怎样的?
答:扣量优先级:免费试用>批量购买,即在“批量购买”的套餐额度剩余的情况下,又领取了免费试用的体验包,则领取的免费试用体验包立即生效,并被设定为当前扣量套餐。而之前购买的套餐包的额度和到期日不变。
修改于 2023-12-18 07:54:13