语音听写自训练平台
基于科大讯飞的语音识别技术,可自行上传语言文本数据集,对语音听写引擎模型进行深度定制。提升垂直领域的语音识别准确率。
#第一步:进入语音听写自训练平台
成功登录讯飞开放平台账户后,通过左上角的【产品服务】-【语音识别】-【语音听写自训练平台】,进入语言模型自训练平台产品页,点击“立即定制”,进入到自训练平台
#第二步:训练自己的模型
目前每个人用户可以免费训练10个模型,通过创建模型-上传测试集-选择基础模型-上传训练数据集,即可进行自动化训练和测试。最终测试的结果会形成测试报告,供您对比训练前后的提升效果。
1、当前版本基础模型只提供听写通用模型,后续将更新更多领域模型。
2、上传的测试集,包含音频和对应的标注文本结果,用来测试训练前后模型的数据效果差异。必须为zip压缩包(最大10M),压缩包结构audio文件夹(存放16K 16BIT 单声道WAV或PCM音频)、text文件夹(UTF-8编码的txt文件,内容与音频对应)。
3、上传的训练集,包含您的垂直行业领域的文本内容,提升对应行业领域音频的识别准确率。要求为UTF-8的txt文件,不支持标点、字母、空格与不可见字符,大小限制在1M以内,训练集文本单行最大42字,并且在文本最后要空一行。
#第三步:接口调用
1、训练完成后,若您觉得效果不错,可以选择上线。
2、上线时,选择绑定的APPID,即可使用该APPID语音听写服务拥有的服务调用次数
3、上线后,可使用语音听写接口进行调用,但是需对以下部分内容进行调整:
(1)接口地址更改为:ws[s]: //ws-api-hu.xfyun.cn/v2/iat
(2)参数domain固定传参 iat_patch
(3)增加patch_id参数,传参值为对应模型的patch_id值,该值可在听写自训练平台列表中获取
#常见问题
1、可以训练多少个模型?
答:每个账号最多可以免费训练10个模型,后续商用策略有变动,将会及时通知
2、训练的模型删除后还可以用吗?
答:训练后的模型删除后,将不可用,所以已经上线的模型需谨慎删除
3、上线的模型接口调用次数怎么获取?
答:上线时,将绑定APPID应用,调用接口将对应消耗该APPID应用的语音听写服务量。若服务量不足,可及时购买
4、训练后的模型,能不能直接在原先语音听写接口调用?
答:暂时不可以,需在接口侧做改动,后续我们将不断提升接口调用便利性。