科大讯飞
  1. Windows&Linux
科大讯飞
  • iOS SDK接入文档
  • 平台文档
    • 开发者新手指南
      • 平台简介
      • 快速指引
    • 服务协议
      • 讯飞开放平台用户服务协议
      • 讯飞星火认知大模型接口服务协议
      • 开发者应用创建规则
      • 讯飞开放平台隐私政策
      • 开发者用户个人信息保护合规指引
      • 开放平台SDK合规使用说明
      • SDK隐私政策总览
      • SDK合规使用说明总览
      • 科大讯飞儿童隐私保护政策
      • 讯飞开放平台SLA协议
      • 讯飞开放平台订购协议
    • 用户认证须知
      • 用户认证简介
      • 企业实名认证
      • 个人实名认证
      • 初创团队认证
      • 学生认证
      • 公益项目认证
      • 个人升级企业认证
    • 财务
      • 退款规则及退款流程
      • 财务相关说明
    • 账号
      • 账号注销与删除流程
      • 账号与应用说明
    • 会员
      • 会员权益详情
      • 会员时效说明
      • 会员试用版
  • 星火认知大模型
    • SparkDesk
      • SparkDesk使用指南
      • SparkDesk隐私政策
      • SparkDesk用户协议
    • 星火认知大模型
      • 服务说明
      • 通用鉴权URL生成说明
      • Spark Android SDK接入文档
      • Linux SDK接入文档
      • Windows SDK接入文档
      • 讯飞星火认知大模型隐私政策
      • Web 文档
        • 星火认知大模型Web API文档
        • 星火大模型V1.5
        • 星火大模型V2
        • 星火大模型V3
    • 星火知识库
      • 星火知识库 API 文档
        • 星火知识库 API 文档
        • 文档问答
        • 文档上传
        • 文档总结
        • 获取文档总结/概要信息
      • 新版Embedding API文档
    • 图片生成
      • 图片生成 API
    • 图片理解
      • 图片理解 API
    • 大模型定制训练平台
      • 产品使用说明
      • 星火微调服务Web API文档文档
        • 星火微调服务Web API文档文档
        • V1.5版本
        • 微调模型
  • 语音识别
    • 语音唤醒(新版)
    • 语音听写
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 音频文件格式说明
      • 语音听写服务说明
      • 语音听写(流式版)SDK隐私政策
      • 语音听写(流式版)SDK合规使用说明
      • HarmonyOS SDK 文档
      • 语音听写自训练平台
      • 语音听写(流式版)WebAPI
    • 语音转写
      • 语音转写服务说明
      • 语音转写 服务协议
      • WebAPI 文档
        • 语音转写 API 文档
        • 文件上传
        • 查询结果
    • 极速语音转写
      • 极速语音转写 API 文档
      • 小文件上传
      • 初始化分块信息
      • 分块上传
      • 分块上传完成
      • 创建任务
      • 查询任务
    • 实时语音转写
      • 实时语音转写服务说明
      • 实时语音转写 API
    • 离线语音听写
      • Android SDK 文档
      • 离线语音听写服务说明
      • 离线语音听写SDK隐私政策
      • 离线语音听写SDK合规使用说明
    • 离线语音听写(新版)
      • Android SDK 文档
      • 离线语音听写隐私政策
    • 语音唤醒
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音唤醒服务说明
      • 离线唤醒SDK隐私政策
    • 语音唤醒(新版)
      • Android SDK 文档
      • Linux SDK 文档
      • 语音唤醒隐私政策
    • 离线命令词识别
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 离线命令词识别服务说明
      • 离线命令词识别SDK隐私政策
      • 离线命令词SDK合规使用说明
  • 语音合成
    • 在线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • Java SDK 文档
      • 服务协议
      • 在线语音合成服务说明
      • 发音人自训练平台使用指南
      • WebAPI
    • 长文本语音合成
      • 长文本语音合成 API 文档
      • 创建任务
      • 查询任务
    • 离线语音合成
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 服务协议
      • 离线语音合成服务说明
    • AI虚拟人技术
      • Web SDK 2.0 接入指南
      • Android-SDK
      • iOS-SDK
      • Web API 文档
        • AI虚拟人技术 API 文档
        • 音频驱动
        • 启动
        • 文本驱动
        • 停止
        • 心跳
  • 语音扩展
    • 语音评测(流式版)
      • 接口说明
      • Android SDK 文档
      • iOS SDK 文档
      • Linux SDK 文档
      • Windows SDK 文档
      • 语音评测SDK隐私政策
      • 语音评测(流式版)API
    • 语音评测suntone
      • 语音评测suntone API
    • 离线变声
      • Android SDK 集成文档
    • 音色转换
      • 音色转换 API
    • 性别年龄识别
      • 性别能力识别 API
    • 声纹识别
      • Web API 文档
      • 声纹识别 API
    • 歌曲识别
      • 歌曲识别 API
    • 歌曲识别 ACRCloud
      • 接口说明
      • 哼唱识别
      • 音乐识别
    • AI 客服中间件
      • 接口说明
      • 获取token
      • 查询配置
      • 直接外呼
      • 创建外呼任务
      • 提交任务数据
      • 启动外呼任务
      • 暂停外呼任务
      • 删除外呼任务
      • 查询任务
      • 结果数据推送
      • 话单推送
      • 录音推送
      • 会话推送
      • 呼入话术上下文动态数据获取
  • 自然语言处理
    • 文本纠错
      • 文本纠错 API
      • 黑白名单上传
    • 公文校队
      • 公文校对 API
    • 文本合规
      • 文本合规 API
      • 新增黑名单词库
      • 根据lib_id添加黑名单词条
      • 根据lib_id查询词条明细
      • 根据lib_id删除词条
      • 根据appid查询账户下所有词库
      • 根据lib_id删除词库
      • 创建白名单库
      • 根据lib_id添加放行词条
      • 根据lib_id查询词条详情
      • 根据lib_id删除词条信息
      • 根据appid查询所有词库列表
      • 根据lib_id删除词库
    • 图片合规
      • 图片合规 API
    • 音频合规
      • 音频合规 API
    • 视频合规
      • 视频合规 API
    • 文本改写
      • 文本改写 API
    • 机器翻译
      • 机器翻译(新) API
    • 机器翻译niutrans
      • 机器翻译niutrans API
    • 同声传译
      • 同声传译 API 
    • 离线分词
      • Android SDK 文档
  • 人脸识别
    • 人脸验证与检索
      • Android SDK 文档
      • iOS SDK 文档
      • 人脸验证与检索SDK隐私政策
      • 人脸验证与检索SDK合规使用说明
    • 人脸对比
      • 人脸比对 API
    • 人脸比对sensetime
      • 人脸比对sensetime API
    • 人脸水印照比对
      • 人脸水印照比对 API
    • 静默活体检测
      • 静默活体检测 API
    • 配合式活体检测
      • 配合式活体检测 API
    • 静默活体检测sensetime
      • 静默活体检测sensetime API
    • 人脸检测和属性分析
      • 人脸检测和属性分析 API
    • 人脸特征分析tuputech
      • 年龄 API
      • 颜值 API
      • 性别 API
      • 表情 API
  • 文字识别
    • 通用文字识别
      • 通用文字识别 API
    • 通用文字识别
      • 通用文字识别 intsig API
    • 手写文字识别
      • 手写文字识别 API
    • 印刷文字识别
      • 印刷文字识别 API
    • 印刷文字识别(多语种)
      • 印刷文字识别(多语种)
    • 印刷文字识别(多语种)intsig
      • 印刷文字识别(多语种)intsig API
    • 图片文档还原
      • 图片文档还原 API 
    • 国内通用票据识别
      • 接口说明
      • 国内通用票据识别 API
    • 离线OCR
      • Android SDK 文档
    • 名片识别 intsig
      • 名片识别 API
    • 身份证识别 intsig
      • 身份证识别 intsig API
    • 银行卡识别 intsig
      • 银行卡识别 API
    • 营业执照识别 intsig
      • 营业执照识别 intsig API
    • 增值税发票识别 intsig
      • 增值税发票识别 intsig API
    • 拍照速算识别
      • 接口说明
      • 拍照速算识别 API
    • 公式识别
      • 接口说明
      • 公式识别 API
    • 指尖文字识别
      • 接口说明
      • 指尖文字识别 API
    • 身份证识别
      • 接口说明
      • 身份证识别 API
    • 增值税发票识别
      • 接口说明
      • 增值税发票识别 API
    • 营业执照识别
      • 接口说明
      • 营业执照识别 API
    • 火车票识别
      • 接口说明
      • 火车票识别 API
    • 出租车发票识别
      • 接口说明
      • 出租车发票识别 API
  • 图像识别
    • 场景识别
      • 场景识别 API
    • 物体识别
      • 物体识别 API
    • 场所识别
      • 场所识别 API 文档
  • 基础服务
    • 云服务器 CVM
      • 云服务器 CVM 产品简介
      • 快速入门
      • 服务协议
  • 解决方案
    • 签到解决方案
      • SaaS操作文档
    • 智能硬件通用方案
      • 智能硬件通用方案说明
      • 麦克风阵列Android SDK
      • 麦克风阵列Linux SDK
      • 双麦阵列设计参考
      • 麦克风阵列录音要求
      • 语音唤醒Android SDK
      • 语音唤醒Linux SDK
      • 离线声纹Android SDK
      • 离线声纹Linux SDK
  • MSC API 文档
    • Android
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • Android 常量字段值
      • 基础类
    • IOS
      • 文件列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 语音评测(Evaluator)
      • 语音唤醒(Wakeuper)
      • 声纹人脸(Verifier)
      • 基础类
    • Windows&Linux
      • 文件列表
      • API 文档
    • Java
      • 所有类列表
      • SDK初始化
      • 语音识别(Recognizer)
      • 语音合成(Synthesizer)
      • 常量字段值
      • 基础类
  1. Windows&Linux

API 文档

MSC for Windows&Linux API#

这里介绍的是Windows&Linux API全部文件的函数及其说明,点击右侧目录可快速找到相应文件。

#msp_cmn.h通用接口#

通用接口(Mobile Speech Platform Common Interface Header File)

#函数#

类型说明
int MSPAPIMSPLogin(const char *usr, const char *pwd, const char *params) 初始化msc,用户登录。
const char *MSPAPIMSPUploadData(const char *dataName, void data, unsigned int dataLen, const charparams, int *errorCode) 用户数据上传。
int MSPAPIMSPLogout 退出登录。
int MSPAPIMSPSetParam(const char *paramName, const char *paramValue) 参数设置接口、离线引擎初始化接口。
int MSPAPIMSPGetParam(const char *paramName, char *paramValue, unsigned int *valueLen) 获取MSC的设置信息。
const char *MSPAPIMSPGetVersion(const char *verName, int *errorCode) 获取MSC或本地引擎版本信息。

#详细描述#

通用接口(Mobile Speech Platform Common Interface Header File)
This file contains the quick common programming interface (API) declarations of MSP. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.

#函数说明#

#MSPLogin()#

初始化msc,用户登录。
参数:
usr[in]
此参数保留,传入NULL即可。
pwd[in]
此参数保留,传入NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务参数名称说明
通用appid应用IDSDK申请成功后获取到的appid。申请SDK请前往讯飞开放平台 ,此参数必须传入
离线engine_start离线引擎启动启动离线引擎,支持参数,ivw:唤醒,asr:识别
离线[xxx]_res_path离线引擎资源路径设置ivw、asr引擎离线资源路径,详细格式如下:fo|[path]|[offset]|[length]|xx|xx。 示例如下,单个资源路径: ivw_res_path=fo|res/ivw/wakeupresource.jet, 多个资源路径:asr_res_path=fo|res/asr/common.jet;fo|res/asr/sms.jet
返回
  成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见:

#MSPUploadData()#

用户数据上传。
参数:
dataName[in]
数据名称字符串。
data[in]
待上传数据缓冲区的起始地址。
dataLen[in]
数据长度(如果是字符串,则不包含'\0')。
params[in]
目前支持以下四种。具体如下:
在线/离线业务参数功能应用业务文件编码
在线"sub = uup,dtt = userword"上传用户词表iatUTF-8
在线"sub = uup,dtt = contact"上传联系人iatUTF-8
返回
  上传成功后,联系人、用户词表功能返回值NULL。
备注
  使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见:

#MSPLogout()#

退出登录。
返回
  如果函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口和MSPLogin配合使用。确保其他接口调用结束之后调用MSPLogout,否则结果不可预期。
参见:

#MSPSetParam()#

参数设置接口、离线引擎初始化接口。
参数:
paramName[in]
参数名,可设置参数如下:
在线/离线业务参数名称说明
离线engine_startengine_start 启动离线引擎启动引擎: 设置paramName为engine_start paramValue为engine_start=asr、ivw离线业务 之后加资源所在路径 例如engine_start=asr,asr_res_path=fo|file_path|[offset]|[length]
离线engine_destroy销毁离线引擎销毁引擎: 设置paramName 为engine_destroy paramValue 为asr 、tts 、ivw ( 如engine_destroy=tts)离线业务
paramValue[in]
参数值。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  无
参见:

#MSPGetParam()#

获取MSC的设置信息。
参数:
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务参数描述
在线upflow上行数据量
在线downflow下行数据量
paramValue[in/out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[in/out]
输入:buffer的大小
输出:信息实际长度(不含'\0')
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  以查询上行流量为例,获取到的是当前累计的上行流量。下行流量查询与此相似。
参见:

#MSPGetVersion()#

获取MSC或本地引擎版本信息
参数:
verName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务参数描述
离线ver_mscMSC版本号
离线ver_asr离线识别版本号,目前不支持
离线ver_tts离线合成版本号
离线ver_ivw离线唤醒版本号
errorCode[out]
如果函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
返回
  成功返回缓冲区指针,失败或数据不存在返回NULL。
备注
  使用其他接口前必须先调用MSPLogin,可以在应用程序启动时调用。
参见
  无

#qisr.h 语音识别#

语音识别(iFLY Speech Recognizer Header File)

#qisr.h 文件参考#

语音识别(iFLY Speech Recognizer Header File)

#函数#

类型说明
const char *MSPAPIQISRSessionBegin(const char *grammarList, const char *params, int *errorCode) 开始一次语音识别。
int MSPAPIQISRAudioWrite(const char *sessionID, const void *waveData, unsigned int waveLen, int audioStatus, int *epStatus, int *recogStatus) 写入本次识别的音频。
const char *MSPAPIQISRGetResult(const char *sessionID, int *rsltStatus, int waitTime, int *errorCode) 获取识别结果。
int MSPAPIQISRSessionEnd(const char *sessionID, const char *hints) 结束本次语音识别。
int MSPAPIQISRGetParam(const char *sessionID, const char *paramName, char *paramValue, unsigned int *valueLen) 获取当次语音识别信息,如上行流量、下行流量等。
int MSPAPIQISRBuildGrammar(const char *grammarType, const char *grammarContent, unsigned int grammarLength, const char *params, GrammarCallBack callback, void *userData) 构建语法,生成语法ID。
int MSPAPIQISRUpdateLexicon(const char *lexiconName, const char *lexiconContent, unsigned int lexiconLength, const char *params, LexiconCallBack callback, void *userData) 更新本地语法词典。

#详细描述#

语音识别(iFLY Speech Recognizer Header File)
This file contains the quick application programming interface (API) declarations of ISR. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.

#函数说明#

#QISRSessionBegin()#

开始一次语音识别。
参数:
grammarList[in]
此参数保留,传入NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务参数名称说明
通用engine_type引擎类型可取值: cloud:在线引擎 local:离线引擎 默认值:cloud
在线sub本次识别请求的类型iat:语音听写 asr:命令词识别。 默认为iat
在线language语言可取值: zh_cn:简体中文 en_us:英文 默认值:zh_cn
在线domain领域iat:语音听写(默认值)
在线accent语言区域可取值: mandarin:普通话(默认值) 其他方言请前往讯飞开放平台控制台查看
通用sample_rate音频采样率可取值:16000,8000 默认值:16000 离线识别不支持8000采样率音频
离线asr_threshold识别门限离线语法识别结果门限值,设置只返回置信度得分大于此门限值的结果 可取值:0~100,默认值:0
离线asr_denoise是否开启降噪功能可取值: 0:不开启,1:开启 默认不开启
离线asr_res_path离线识别资源路径离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd,
离线grm_build_path离线语法生成路径构建离线语法所生成数据的保存路径(文件夹)
通用result_type结果格式可取值:plain,json 默认值:plain
通用text_encoding文本编码格式表示参数中携带的文本编码格式
离线local_grammar离线语法id构建离线语法后获得的语法ID
通用ptt添加标点符号(仅sub=iat时有效)0:无标点符号;1:有标点符号。默认为1
在线aue音频编码格式和压缩等级编码算法:raw;speex;speex-wb;ico 编码等级:raw:不进行压缩。speex系列:0-10; 默认为speex-wb;7 speex对应sample_rate=8000 speex-wb对应sample_rate=16000 ico对应sample_rate=16000
通用result_encoding识别结果字符串所用编码格式GB2312;UTF-8;UNICODE 不同的格式支持不同的编码: plain:UTF-8,GB2312 json:UTF-8
通用vad_enableVAD功能开关是否启用VAD 默认为开启VAD 0(或false)为关闭
通用vad_bos允许头部静音的最长时间(目前未开启该功能)0-10000毫秒。默认为10000 如果静音时长超过了此值,则认为用户此次无有效音频输入。此参数仅在打开VAD功能时有效。
通用vad_eos允许尾部静音的最长时间0-10000毫秒。默认为2000 如果尾部静音时长超过了此值,则认为用户音频已经结束,此参数仅在打开VAD功能时有效。
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
  函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次识别的句柄。 。
备注
  参数只在当次识别中生效。
参见:

#QISRAudioWrite()#

写入本次识别的音频。
参数:
sessionID[in]
由QISRSessionBegin返回的句柄。
waveData[in]
音频数据缓冲区起始地址。
waveLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量简介
MSP_AUDIO_SAMPLE_FIRST = 1第一块音频
MSP_AUDIO_SAMPLE_CONTINUE = 2还有后继音频
MSP_AUDIO_SAMPLE_LAST = 4最后一块音频
epStatus[out]
端点检测(End-point detected)器所处的状态,可能的值如下:
枚举常量简介
MSP_EP_LOOKING_FOR_SPEECH = 0还没有检测到音频的前端点。
MSP_EP_IN_SPEECH = 1已经检测到了音频前端点,正在进行正常的音频处理。
MSP_EP_AFTER_SPEECH = 3检测到音频的后端点,后继的音频会被MSC忽略。
MSP_EP_TIMEOUT = 4超时。
MSP_EP_ERROR = 5出现错误。
MSP_EP_MAX_SPEECH = 6音频过大。
rsltStatus[out]
识别器返回的状态,提醒用户及时开始\停止获取识别结果。典型值如下:
枚举常量简介
MSP_REC_STATUS_SUCCESS = 0识别成功,此时用户可以调用QISRGetResult来获取(部分)结果。
MSP_REC_STATUS_NO_MATCH = 1识别结束,没有识别结果。
MSP_REC_STATUS_INCOMPLETE = 2正在识别中。
MSP_REC_STATUS_COMPLETE = 5识别结束。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注:
  本接口需不断调用,直到音频全部写入为止。上传音频时,需更新audioStatus的值。具体来说:
  当写入首块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_FIRST
  当写入最后一块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_LAST
  其余情况下,将audioStatus置为MSP_AUDIO_SAMPLE_CONTINUE
  同时,需定时检查两个变量:epStatus和rsltStatus。具体来说:
  当epStatus显示已检测到后端点时,MSC已不再接收音频,应及时停止音频写入
  当rsltStatus显示有识别结果返回时,即可从MSC缓存中获取结果
参见:

#QISRGetResult()#

获取识别结果。
参数:
sessionID[in]
由QISRSessionBegin返回的句柄。
rsltStatus[out]
识别结果的状态,其取值范围和含义请参考QISRAudioWrite 的参数recogStatus。
waitTime[in]
此参数做保留用。
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回:
  函数执行成功且有识别结果时,返回结果字符串指针;其他情况(失败或无结果)返回NULL。
备注:
  当写入音频过程中已经有部分识别结果返回时,可以获取结果。在音频写入完毕后,用户需反复调用此接口,直到识别结果获取完毕(rlstStatus值为5)或返回错误码。 注意:如果某次成功调用后暂未获得识别结果,请将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见:
char rslt_str[ 2048 ] ={'\0'};
const char* rec_result = NULL;
int rslt_status = 0;
int ret = 0;
while(MSP_REC_STATUS_SPEECH_COMPLETE != rslt_status )
{
    rec_result = QISRGetResult ( sessionID, &rslt_status, 5000, &ret );
    if( MSP_SUCCESS  != ret )
    {
        printf( "QISRGetResult failed, error code is: %d", ret );
        break;
    }
    if( NULL != rec_result )
    {
     // 用户可以用其他的方式保存识别结果
        strcat( rslt_str, rec_result );
        continue;
    }
    // sleep 一下很有必要,防止MSC 端无缓存的识别结果时浪费CPU 资源
    Sleep( 200 );
}
.

#QISRSessionEnd()#

结束本次语音识别。
参数
sessionID[in]
由QISRSessionBegin返回的句柄。hints[in]结束本次语音识别的原因描述,为用户自定义内容。
返回  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注  本接口和QISRSessionBegin对应,调用此接口后,该句柄对应的相关资源(参数、语法、音频、实例等)都会被释放,用户不应再使用该句柄。
参见
int ret = QISRSessionEnd ( sessionID, "normal end" );
if( MSP_SUCCESS  != ret )
{
    printf( "QISRSessionEnd failed, error code is: %d", ret );
}
.

#QISRGetParam()#

获取当次语音识别信息,如上行流量、下行流量等。
参数
sessionID[in]
由QISRSessionbegin返回的句柄,如果为NULL,获取MSC的设置信息。
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务参数描述
在线sid服务端会话ID,长度为32字节
在线upflow上行数据量
在线downflow下行数据量
通用volume最近一次写入的音频的音量
paramValue[out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[out]
输入:buffer的大小
输出:信息实际长度(不含’\0’)
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  以查询上行流量为例,获取到的是本次识别当前累计的上行流量。下行流量查询与此相似。
参见
const char * para_name = "upflow";
char para_value[32] = {'\0'};
unsigned int value_len = 32;
int ret = QISRGetParam ( sessionID, para_name, para_value, &value_len );
if( MSP_SUCCESS != ret )
{
    printf( "QISRGetParam failed, error code is: %d", ret );
}
.

#QISRBuildGrammar()#

构建语法,生成语法ID。
参数
grammarType[in]
语法类型,离线识别采用bnf 格式语法。
grammarContent[in]
语法内容。
grammarLength[in]
语法长度。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务参数名称说明
通用engine_type引擎类型可取值: local:离线引擎
通用sample_rate音频采样率可取值:16000,8000, 默认值:16000
离线asr_res_path离线识别资源路径离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd, 其中文件路径必须是包含文件名的完整路径; offset:资源文件在此传入文件中的偏移; length:资源文件大小。
离线grm_build_path离线语法生成路径构建离线语法所生成数据的保存路径(文件夹)
callback[in]
构建语法回调接口。typedef int ( GrammarCallBack)( int errorCode, const char info, void* userData);
userData[in/out]
用户数据。
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  无
参见
  无

#QISRUpdateLexicon()#

更新本地语法词典。
参数
lexiconName[in]
词典名称。更新本地语法词典:传递语法中需要更新的词典槽名称
lexiconContent[in]
词典内容。本地语法词典:词典内容为换行符分割的字符串列表,如:"词条1\n 词条2\n 词条3\n 词条4"
lexiconLength[in]
词典内容长度。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务参数名称说明
通用engine_type引擎类型可取值: cloud:在线引擎, local:离线引擎, 默认值:cloud
在线subject业务类型必须由用户指定,更新云端词典设置为uup
在线data_type数据类型必须由用户指定。 更新云端联系人:contact 更新云端个性化词表:userword
通用text_encoding文本编码格式表示参数中携带的文本编码格式 可取值:GB2312,GBK,UTF-8,UTF-16LE,UTF-16BE
通用sample_rate音频采样率可取值:16000,8000, 默认值:16000
离线asr_res_path离线识别资源路径离线识别资源所在路径,对应格式如下: access_type1|file_info1|[offset1]|[length1];access_type2|file_info2|[offset2]|[length2] 各字段含义如下: access_type:文件访问方式,支持路径方式(fo)和文件描述符方式(fd); file_info:此字段和access_type 对应,文件路径对应fo,文件描述符对应fd, 其中文件路径必须是包含文件名的完整路径; offset:资源文件在此传入文件中的偏移; length:资源文件大小。
离线grm_build_path离线语法生成路径构建离线语法所生成数据的保存路径(文件夹)
离线grammar_list语法id 列表指定需要更新的离线语法id 列表,支持一次性更新多个语法, 格式如下:id1;id2
callback[in]
更新词典回调接口。typedef int (LexiconCallBack)(int errorCode, const char info, void* userData);
userData[in/out]
用户数据。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  无
参见
  无

#qtts.h 语音合成#

语音合成(iFLY Speech Synthesizer Header File)

#函数#

类型说明
const char *MSPAPIQTTSSessionBegin(const char *params, int *errorCode) 开始一次语音合成,分配语音合成资源。
int MSPAPIQTTSTextPut(const char *sessionID, const char *textString, unsigned int textLen, const char *params) 写入要合成的文本。
const void *MSPAPIQTTSAudioGet(const char *sessionID, unsigned int *audioLen, int *synthStatus, int *errorCode) 获取合成音频。
int MSPAPIQTTSSessionEnd(const char *sessionID, const char *hints) 结束本次语音合成。
int MSPAPIQTTSGetParam(const char *sessionID, const char *paramName, char *paramValue, unsigned int *valueLen) 获取当前语音合成信息,如当前合成音频对应文本结束位置、上行流量、下行流量等。

#详细描述#

语音合成(iFLY Speech Synthesizer Header File)
This file contains the quick application programming interface (API) declarations of TTS. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.

#函数说明#

#QTTSSessionBegin()#

开始一次语音合成,分配语音合成资源。
参数
params[in]
传入的参数列表,支持以下参数:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
在线/离线业务参数名称说明
通用engine_type引擎类型可取值: cloud:在线引擎 local:离线引擎,默认为cloud
通用voice_name发音人不同的发音人代表了不同的音色, 如男声、女声、童声等,具体参数值请到控制台-发音人授权管理 确认
通用speed语速合成音频对应的语速, 取值范围:[0,100],数值越大语速越快。 默认值:50
通用volume音量合成音频的音量, 取值范围:[0,100],数值越大音量越大。 默认值:50
通用pitch语调合成音频的音调, 取值范围:[0,100],数值越大音调越高。 默认值:50
离线tts_res_path合成资源路径合成资源所在路径,支持fo 方式参数设置,对应格式如下: fo|[file_info]|[offset]|[length] (1)若是合并资源,则只需传入一个资源路径,如:fo| combined.jet|0|1024 (2)若是分离资源,则需传两个资源路径,如:fo|common.jet|0|1024;fo| xiaoyan.jet|0|1024
通用rdn数字发音合成音频数字发音,支持参数, 0 数值优先, 1 完全数值, 2 完全字符串, 3 字符串优先, 默认值:0
离线rcn1 的中文发音支持参数: 0:表示发音为yao 1:表示发音为yi 默认值:0
通用text_encoding文本编码格式(必传)合成文本编码格式,支持参数,GB2312,GBK,BIG5,UNICODE,GB18030,UTF8
通用sample_rate合成音频采样率合成音频采样率,支持参数,16000,8000(离线高品质合成暂不支持),默认为16000
在线background_sound背景音合成音频中的背景音,支持参数, 0:无背景音乐, 1:有背景音乐
在线aue音频编码格式和压缩等级码算法:raw;speex;speex-wb;ico 编码等级:raw:不进行解压缩 speex系列:0-10; 默认为speex-wb;7 speex对应sample_rate=8000 speex-wb对应sample_rate=16000 ico对应sample_rate=16000
在线ttp文本类型合成文本类型,支持参数, text: 普通格式文本 cssml:cssml 格式文本 默认值:text
离线speed_increase语速增强通过设置此参数控制合成音频语速基数,取值范围, 1:正常 2:2 倍语速 4:4 倍语速
离线effect合成音效合成音频的音效,取值范围, 0 无音效,1 忽远忽近,2 回声,3 机器人,4 合唱,5 水下,6 混响,7 阴阳怪气
注意:没有默认值的参数必须由外部设定其值
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
返回
  函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次合成的句柄。
备注
  参数只在本次合成中生效。
参见

#QTTSTextPut()#

写入要合成的文本。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
textString[in]
字符串指针。指向待合成的文本字符串。
textLen[in]
合成文本长度,最大支持8192个字节(不含’\0’)。
params[in]
本次合成所用的参数,只对本次合成的文本有效。目前为空。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口不支持连续被调用。调用本接口写入合成文本后,用户需要反复调用QTTSAudioGet 接口来获取音频。
参见

#QTTSAudioGet()#

获取合成音频。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
audioLen[out]
合成音频长度,单位字节。
synthStatus[out]
合成音频状态,可能的值如下:
枚举常量简介
MSP_TTS_FLAG_STILL_HAVE_DATA = 1音频还没取完,还有后继的音频
MSP_TTS_FLAG_DATA_END = 2音频已经取完
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
返回
  函数调用成功且有音频数据时返回非空指针。调用失败或无音频数据时,返回NULL。
备注
  用户需要反复获取音频,直到音频获取完毕或函数调用失败。在重复获取音频时,如果暂未获得音频数据,需要将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见

#QTTSSessionEnd()#

结束本次语音合成。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄。
hints[in]
结束本次语音合成的原因描述,为用户自定义内容。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口和QTTSSessionBegin对应,调用此接口后,该句柄对应的相关资源(参数,合成文本,实例等)都会被释放,用户不应再使用该句柄。
参见

#QTTSGetParam()#

获取当前语音合成信息,如当前合成音频对应文本结束位置、上行流量、下行流量等。
参数
sessionID[in]
由QTTSSessionBegin返回的句柄,如果为NULL,获取MSC的设置信息。
paramName[in]
参数名,一次调用只支持查询一个参数。参数如下:
在线/离线业务参数名称意义
在线sid服务端会话ID,长度为32字节
在线upflow上行数据量。
在线downflow下行数据量
通用ced当前合成音频对应文本结束位置
paraValue[in/out]
输入:buffer首地址
输出:向该buffer写入获取到的信息
valueLen[in/out]
输入:buffer的大小
输出:信息实际长度(不含'\0')
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  以查询上行流量为例,获取到的是本次合成当前累计的上行流量。下行流量查询与此相似。
参见

#qise.h 语音评测#

语音评测(iFLY Speech Evaluation Header File)

#函数#

类型说明
const char *MSPAPIQISESessionBegin(const char *params, const char *userModelId, int *errorCode) 开始一次语音评测。
int MSPAPIQISETextPut(const char *sessionID, const char *textString, unsigned int textLen, const char *params) 写入待评测的文本。
int MSPAPIQISEAudioWrite (const char *sessionID, const void *waveData, unsigned int waveLen, int audioStatus, int *epStatus, int *Status) 写入本次评测的音频。
const char *MSPAPIQISEGetResult(const char *sessionID, unsigned int *rsltLen, int *rsltStatus, int *errorCode) 获取评测结果。
int MSPAPIQISESessionEnd(const char *sessionID, const char *hints) 结束本次语音评测。

#详细描述#

语音评测(iFLY Speech Evaluation Header File)
This file contains the quick application programming interface (API) declarations of evaluation. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.

#函数说明#

#QISESessionBegin()#

开始一次语音评测。
参数
params[in]
传入的参数列表,支持以下参数:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
参数参数说明值
sub本次评测请求的类型ise
aue音频编码格式和压缩等级编码算法:raw;speex;speex-wb;ico 编码等级:raw:无等级。speex系列:0-10; 默认为speex-wb;7 speex-wb对应audio/L16;rate=16000 ico对应audio/L16;rate=16000
auf音频格式audio/L16;rate=16000 默认为audio/L16;rate=16000
rse评测结果字符串所用编码格式gb2312
vad_timeout允许头部静音的最长时间0-10000毫秒。默认为10000 如果静音时长超过了此值,则认为用户此次无有效音频输入。此参数仅在打开VAD功能时有效。
vad_speech_tail允许尾部静音的最长时间0-10000毫秒。默认为2000 如果尾部静音时长超过了此值,则认为用户音频已经结束,此参数仅在打开VAD功能时有效。
vad_enableVAD功能开关是否启用VAD 默认为开启VAD 0(或false)为关闭
category评测类型read_syllable(当language=en_us时,不支持) read_word read_sentence
language评测语言zh_cn:简体中文 en_us:英语 默认为zh_cn
注意:没有默认值的参数必须由外部设定其值
userModelId[in]
此参数保留,传入NULL即可。
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
返回
  函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次评测的句柄。
备注
  参数只在当次评测中生效.
参见

#QISETextPut()#

写入待评测的文本。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
textString[in]
字符串指针。指向待评测的文本字符串。
textLen[in]
评测文本长度。
params[in]
本次评测所用的参数,只对本次评测的文本有效。
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码。详见错误码列表 。
参见

#QISEAudioWrite()#

写入本次评测的音频。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
waveData[in]
音频数据缓冲区起始地址。
waveLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量描述
MSP_AUDIO_SAMPLE_FIRST = 1第一块音频
MSP_AUDIO_SAMPLE_CONTINUE = 2还有后继音频
MSP_AUDIO_SAMPLE_LAST = 4最后一块音频
epStatus[out]
端点检测(End-point detected)器所处的状态,可能的值如下:
枚举常量描述
MSP_EP_LOOKING_FOR_SPEECH = 0还没有检测到音频的前端点
MSP_EP_IN_SPEECH = 1已经检测到了音频前端点,正在进行正常的音频处理
MSP_EP_AFTER_SPEECH = 3检测到音频的后端点,后继的音频会被MSC忽略
MSP_EP_TIMEOUT = 4超时
MSP_EP_ERROR = 5出现错误
MSP_EP_MAX_SPEECH = 6音频过大
注意:当epStatus大于等于3时,用户应当停止写入音频的操作,否则写入MSC的音频会被忽略。
recogStatus[out]
评测器返回的状态,提醒用户及时开始\停止获取评测结果。典型值如下:
枚举常量描述
MSP_REC_STATUS_SUCCESS = 0评测成功,有评测结果返回
MSP_REC_STATUS_NO_MATCH = 1评测结束,没有评测结果
MSP_REC_STATUS_INCOMPLETE = 2正在评测
MSP_REC_STATUS_COMPLETE = 5评测结束,有评测结果返回
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口需不断调用,直到音频全部写入为止。上传音频时,需更新audioStatus的值。具体来说:
  当写入首块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_FIRST
  当写入最后一块音频时,将audioStatus置为MSP_AUDIO_SAMPLE_LAST
  其余情况下,将audioStatus置为MSP_AUDIO_SAMPLE_CONTINUE
  同时,需定时检查两个变量:epStatus和rsltStatus。具体来说:
  当epStatus显示已检测到后端点时,MSC已不再接收音频,应及时停止音频写入
  当rsltStatus显示有评测结果返回时,即可从MSC缓存中获取结果
参见

#QISEGetResult()#

获取评测结果。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
rsltLen[out]
评测结果长度,单位字节。
rsltStatus[out]
评测结果的状态,其取值范围和含义请参考QISEAudioWrite的参数recogStatus。
errorCode[out]
函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表。
返回
  函数执行成功且有评测结果时,返回结果字符串指针;其他情况(失败或无结果)返回NULL。
备注
  当写入音频过程中已经有部分评测结果返回时,可以获取结果。在音频写入完毕后,用户需反复调用此接口,直到评测结果获取完毕(rlstStatus值为5)或返回错误码。
注意:如果某次成功调用后暂未获得评测结果,请将当前线程sleep一段时间,以防频繁调用浪费CPU资源。
参见

#QISESessionEnd()#

结束本次语音评测。
参数
sessionID[in]
由QISESessionBegin返回的句柄。
hints[in]
结束本次语音评测的原因描述,为用户自定义内容。
返回
  函数调用成功返回MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口和QISESessionBegin对应,调用此接口后,该句柄对应的相关资源都会被释放,用户不应再使用该句柄。
参见

#qivw.h 语音唤醒#

语音唤醒(iFLY Speech Voice Wakeup Header File)

#函数#

类型说明
const char *MSPAPIQIVWSessionbegin(const char *grammarList, const char *params, int *errorCode)开始唤醒功能,并在参数中指定唤醒(唤醒+识别时)用到的语法列表,本次唤醒所用的参数等。
int MSPAPIQIVWSessionEnd(const char *sessionID, const char *hints)结束本次语音唤醒。
int MSPAPIQIVWAudioWrite(const char *sessionID, const void *audioData, unsigned int audioLen, int audioStatus)写入本次唤醒的音频,本接口需要反复调用直到音频写完为止。
int MSPAPIQIVWRegisterNotify(const char *sessionID, ivw_ntf_handler msgProcCb, void *userData)注册回调。

#详细描述#

语音唤醒(iFLY Speech Voice Wakeup Header File)
This file contains the quick application programming interface (API) declarations of IVW. Developer can include this file in your project to build applications. For more information, please read the developer guide.
Use of this software is subject to certain restrictions and limitations set forth in a license agreement entered into between iFLYTEK, Co,LTD. and the licensee of this software. Please refer to the license agreement for license use rights and restrictions.
Copyright (C) by iFLYTEK, Co,LTD. All rights reserved.

#函数说明#

#QIVWSessionBegin()#

开始唤醒功能,本次唤醒所用的参数等。
参数:
grammarList[in]
保留参数,设置为NULL即可。
params[in]
参见下表:
格式说明:每个参数和参数值通过key=value的形式组成参数对;如果有多个参数对,再用逗号进行拼接,如:key_1=value_1,key_2=value_2
注意:每个参数(key)和参数值(value)均不得含有逗号(,)和等号(=),否则会被截断
参数参数说明是否必要
sst业务类型。唤醒业务类型,可以设置如下参数: wakeup:语音唤醒(默认) oneshot:唤醒加识别是
ivw_threshold唤醒词门限。 设置格式如下: id0:xx;id1:xx;….。 示例:0:1450;1:1450表示设置第一个唤醒词的门限值为1450,第二个唤醒的门限值是1450,门限值越低越容易唤醒成功。 注意:建议唤醒引擎门限值设为1450,且取值范围为非负数,一般可在0-3000之间调节。否
ivw_shot_word音频是否包含唤醒词。 用于唤醒加识别时场景,将音频送入识别引擎时是否包含唤醒词音频: 0:不包含,1:包含(默认)否
errorCode[out]
函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
返回
  函数调用成功返回字符串格式的sessionID,失败返回NULL。sessionID是本次唤醒的句柄。
备注
  参数只在当次唤醒中生效。
参见:

#QIVWSessionEnd()#

结束本次语音唤醒。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
hints[in]
结束本次语音唤醒的原因描述,为用户自定义内容。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  本接口和QIVWSessionBegin 对应,用来本次语音唤醒。调用此接口后,该句柄对应的相关资源(参数、语法、音频、实例等)都会被释放,用户不应再使用该句柄。
参见:

#QIVWAudioWrite()#

写入本次唤醒的音频,本接口需要反复调用直到音频写完为止。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
audioData[in]
音频数据缓冲区起始地址。
audioLen[in]
音频数据长度,单位字节。
audioStatus[in]
用来告知MSC音频发送是否完成,典型值如下:
枚举常量简介
MSP_AUDIO_SAMPLE_FIRST = 1第一块音频
MSP_AUDIO_SAMPLE_CONTINUE = 2还有后继音频
MSP_AUDIO_SAMPLE_LAST = 4最后一块音频
paramValue[in]
参数值。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  调用本接口时,推荐用户在写入音频时采取"边录边写"的方式,即每隔一小段时间将采集到的音频通过本接口写入MSC。
参见:

#QIVWRegisterNotify()#

注册回调。
参数:
sessionID[in]
由QIVWSessionBegin返回的句柄。
msgProcCb[in]
注册通知的回调函数,唤醒结果将在此注册回调中返回。格式为:typedef int( *ivw_ntf_handler)( const char *sessionID, int msg,int param1, int param2, const void *info, void *userData );参数说明:
参数说明
sessionID由QIVWSessionBegin返回的句柄。
msgMSP_IVW_MSG_WAKEUP=1 唤醒消息,在info中给出唤醒结果缓存首地址,param2 给出唤醒结果的长度。 MSP_IVW_MSG_ERROR=2 出错通知消息,在param1 中给出错误码。 MSP_IVW_MSG_ISR_RESULT=3 唤醒+识别结果消息,在info 中给出识别结果缓存首地址,param2 给出识别结果的长度。param1 中给出给出结果状态,结果状态值参见QISRAudioWrite接口中结果状态说明。 MSP_IVW_MSG_ISR_EPS=4 唤醒+识别结果中vad 端点检测消息,param1 给出端点检测状态,状态值参见QISRAudioWrite接口中端点检测状态说明。
param1参见msg 消息说明
param2参见msg 消息说明
info参见msg 消息说明,主要内容包括sst,id,score,bos,eos等
sst本次业务标识:wakeup 表示语音唤醒;enroll 表示唤醒词训练(当前版本不支持)
id当前唤醒词的id
keyword当前唤醒词。注:中文唤醒词返回的是拼音,例:ding1dong1ding1dong1
score当前唤醒得分
bos当前唤醒音频的前端点
eos当前唤醒音频的尾端点
userData用户数据
userData[in]
用户数据。
返回
  函数调用成功则其值为MSP_SUCCESS,否则返回错误代码,详见错误码列表 。
备注
  通过此函数注册回调函数到msc。如果唤醒成功,msc 调用回调函数通知唤醒成功息同时给出相应唤醒数据。如果出错,msc 调用回调函数给出错误信息。
参见:
上一页
文件列表
下一页
所有类列表
Built with