语音听写自训练平台

基于科大讯飞的语音识别技术，可自行上传语言文本数据集，对语音听写引擎模型进行深度定制。提升垂直领域的语音识别准确率。

#第一步：进入语音听写自训练平台

成功登录讯飞开放平台账户后，通过左上角的【产品服务】-【语音识别】-【语音听写自训练平台】，进入语言模型自训练平台产品页，点击“立即定制”，进入到自训练平台

目前每个人用户可以免费训练10个模型，通过创建模型-上传测试集-选择基础模型-上传训练数据集，即可进行自动化训练和测试。最终测试的结果会形成测试报告，供您对比训练前后的提升效果。

1、当前版本基础模型只提供听写通用模型，后续将更新更多领域模型。

2、上传的测试集，包含音频和对应的标注文本结果，用来测试训练前后模型的数据效果差异。必须为zip压缩包（最大10M），压缩包结构audio文件夹（存放16K 16BIT 单声道WAV或PCM音频）、text文件夹（UTF-8编码的txt文件，内容与音频对应）。

3、上传的训练集，包含您的垂直行业领域的文本内容，提升对应行业领域音频的识别准确率。要求为UTF-8的txt文件，不支持标点、字母、空格与不可见字符，大小限制在1M以内，训练集文本单行最大42字，并且在文本最后要空一行。

1、训练完成后，若您觉得效果不错，可以选择上线。

2、上线时，选择绑定的APPID，即可使用该APPID语音听写服务拥有的服务调用次数

3、上线后，可使用语音听写接口进行调用，但是需对以下部分内容进行调整：

（1）接口地址更改为：ws[s]: //ws-api-hu.xfyun.cn/v2/iat

（2）参数domain固定传参 iat_patch

（3）增加patch_id参数，传参值为对应模型的patch_id值，该值可在听写自训练平台列表中获取

1、可以训练多少个模型？

答：每个账号最多可以免费训练10个模型，后续商用策略有变动，将会及时通知

2、训练的模型删除后还可以用吗？

答：训练后的模型删除后，将不可用，所以已经上线的模型需谨慎删除

3、上线的模型接口调用次数怎么获取？

答：上线时，将绑定APPID应用，调用接口将对应消耗该APPID应用的语音听写服务量。若服务量不足，可及时购买

4、训练后的模型，能不能直接在原先语音听写接口调用？

答：暂时不可以，需在接口侧做改动，后续我们将不断提升接口调用便利性。

最后修改时间： 1 年前