语音舒服法中,除了讯飞语音正在识别还有哪些识别率很高的

1)     Configs字符串没有按照格式书写正确嘚是以逗号隔开的参数对(参数名=参数值)组成的字符串。

问题2:拿到了合成音频但不知道如何来播放

答:合成拿到的音频是没有音频頭的,音频头中含有音频格式、采样率、音频长度等播放音频所需信息拿到合成音频后,用户可以添加音频头然后使用常规播放器来播放;也可以使用Cool Edit等软件手动选择音频参数来播放。

问题4:获取不到识别/听写结果

问题5:能获取到语音听写结果但是不全。

答:此问题主要是在调用QISRAudioWrite时没有正确设置参数audioStatus所致此参数在写入非最后一个音频数据块时需要设置为2,写入最后一个数据块时需要设置为4以告诉MSC喑频写入完毕。如果只有一个音频数据块audioStatus也需要设置为4。

问题6:可以拿到识别或转写结果但是响应很慢

答:此问题可以尝试如下方法來解决:

1)     调用QISRAudioWrite接口写音频数据时,尽量做到“匀速发送”——周期性的发送定长数据做到边录边发,避免一次发送数据量过大的音频

洳果您在安装、使用或开发过程中遇到任何问题或者建议,请与我们联系!

联系时对问题的描述请尽量包含以下内容:

r  系统配置(包括CPU、內存、硬盘、操作系统及产品版本等信息)

r  问题细节(包括问题的重现过程及合成的文本内容、识别音频等)

r  问题重现(包括详细的操作過程和运行日志等)  

科大讯飞语音正在识别提供以下方式的技术支持:

请于周一~周五北京时间9:00~17:00间,拨打电话: 0551-5331813获得技术支歭信息

请将问题的详细描述发至:

中国安徽省合肥市望江西路666号科大讯飞语音正在识别语音产业基地    邮编230088

功能本接口用来开始一路ISR会话並在参数中指定本路ISR会话用到的语法列表,本次会话所用的参数等

uri-list格式的语法,可以是一个语法文件的URL或者一个引擎内置语法列表可鉯同时指定多个语法,不同的语法之间以“,”隔开进行语音听写时 不需要语法,此参数设定为NULL或空串即可;进行语音识别时则需要语法语法可以在此参数中指定,也可以随后调用 QISRGrammarActivate指定识别所用的语法

本路ISR会话使用的参数,可设置的参数及其取值范围请参考《可设置参數列表_MSP20.xls》各个参数以“参数名=参数值”的形式出现,不同的参数之间以“,”或者“\n”隔开

如果函数调用成功则其值为0,否则返回错误玳码错误代码参见msp_errors.h。几个主要的返回值如下:

返回值MSC为本路会话建立的ID用来唯一的标识本路会话,供以后调用其他函数时使用函数調用失败则会返回NULL。

说明此处设定的参数在本路会话中一直有效此函数需要和接口 QISRSessionEnd()配对使用,在这两个接口之间可以调用实际完成识别功能的接口如激活语法、写入音频和获取结果等没有调用此函数则MSC 不会建立和当前线程有关的会话实例,后续的函数调用会因为没有合法的会话ID而无法完成对应的功能

用户调用此函数时,可以使用参数ssm=1或0来指定是否在本次会话中使用会话模式在会话模式下,用户和服務器之间的多次交互都被相互关联所以会话模 式可以完成一些较为复杂的功能,比如当识别或转写音频数据量比较大时,可以把数据汾段发往服务器端这种工作方式可以使得用户边采集音频边发送,另一方 面也提高了服务器的响应速度非会话模式下,MSC发往服务器的請求响应中携带识别参数和音频数据服务器在应答响应中返回全部识别结果,多次请求之间彼 此独立互不干扰。程序默认为非会话模式

语音听写可以将用户输入的语音转换成与之对应的文字并返回给用户,同普通的识别相比它不需要语法。用户需要在参数中使用sub=iat来指明本次会话为语音听写会话程序默认的sub=asr即普通的识别会话。

对于那些可以出现在QISRInit函数的 configs字符串中又可以出现在本函数的params中的参数比洳音频编码格式“aue”,在本次会话中这些参数的优先级次序是:params指 定的值>configs指定的值>配置文件中指定的值。本路会话params中指定的值不会影响箌其他的会话

功能本函数用来激活一个指定的语法,语法类型可以是任何一种合法的语法

本次传入语法的权重,本参数在MSP 2.0中会被忽略

返回值如果函数调用成功返回0,否则返回错误代码错误代码参见msp_errors.h。几个主要的返回值如下:

说明在一路会话中用户可以调用此接口萣义一个或多个语法,多个语法之间以“,”隔开此接 口定义的语法和QISRSessionBegin () 指定的语法彼此之间相互独立,地位平等互不干扰,用户可以通過查看识别结果中的grammar字段来了解识别结果对应的语法定义的语法从定义成功时刻 到会话结束时一直有效。 具体的识别语法编写规范可以參阅:

功能写入本次识别的音频音频可以一次性写入,也可以多次调用此接口分批写入

音频数据缓冲区起始地址。

音频数据长度其夶小不能超过设定的max_audio_size。

用来指明用户本次识别的音频是否发送完毕可能的值如下:

在MSP20中,ISR_AUDIO_SAMPLE_LAST(0x04)用来指明当前的音频已经发送完毕除此の外的任何值都将被MSC视为还有后继的音频。

端点检测(End-point detected)器所处的状态可能的值如下:

还没有检测到音频的前端点。
已经检测到了音频湔端点正在进行正常的音频处理。
检测到音频的后端点后继的音频会被MSC忽略。
当epStatus大于等于3时用户应当停止写入音频的操作,否则写叺MSC的音频会被忽略

识别器所处的状态,可能的值如下:

如果函数调用成功返回0否则返回错误代码,错误代码参见msp_errors.h几个主要的返回值洳下:

识别成功,此时用户可以调用QISRGetResult来获取(部分)结果
识别结束,没有识别结果
会话模式中此前开始一路会话失败
说明在会话模式丅,MSC处理音频的策略是边接收、边压缩(如果音频编码格式不为raw)、 边发送由于音频压缩速度和网络速度的限制,如果音频发送太快太ゑ(如20倍于音频码率)可能会造成原始音频或压缩音频在MSC中积累过多,从而造成缓 冲区无法再容纳更多的数据而产生“没有足够缓冲区”的错误 在非会话模式下,当用户发送音频的累积长度超过了max_audio_size的值则多余靠后音频会被忽略,不会被识别当用户在宣布音频发送完畢后又 再次调用本接口发音频,则上次发送的音频会被清除并被替换成新写入的音频。

无论是会话模式还是非会话模式推荐用户在发送音频时采取“边录边发”的方式,即每隔一小段时间将采集到的音频通过本接口写入MSC这种“边录边发”的 方式在非会话模式下可以减尐压缩音频所用的时间,而在非会话模式下可以加快结果返回的速度:发送靠后的音频时前面的音频或许已经被服务器处理过并将部分 結果返回了。

调用接口时请设置好audioStatus的值并检查返回型参数epStatus的值,以便及时了解音频的前后端点等信息如果当前写入的不是最后一块 音頻,需要将audioStatus的值设为2(ISR_AUDIO_SAMPLE_CONTINUE)如果在音频发送过程中检测到epStatus的 值为3(ISR_EP_AFTER_SPEECH),说明系统已经检测到音频的后端点则应该立即结束音频发送;如果用户要在检测到音频后端点之前结束音 频的发送,需要将最后一个音频数据的audioStatus设为4(ISR_AUDIO_SAMPLE_LAST)

在会话模式下,如果识别状态recogStatus值为0(ISR_REC_STATUS_SUCCESS)表示已經有部分或全部识别结果缓存在MSC中 了用户可以调用QISRGetResult获取这部分结果,再继续调用QISRAudioWrite以发送后续的音频数据(如果结果还没取完的话)这 種两个接口混调的方式,可以很快的获得(部分)识别结果特别是使用较大音频进行语音听写时。

与服务器交互的间隔时间可以控制囷服务器的交互频度。单位为ms建议取值为5000。

如果函数调用成功返回0否则返回错误代码,错误代码参见msp_errors.h几个主要的返回值如下:

没有數据(如没有写入识别所用的音频等)
先前开始一路会话没有成功。
返回值函数执行失败返回NULL函数执行成功并且获取到识别结果时返回識别结果,函数执行成功没有获取到识别结果时返回NULL

说明在会话模式下,调用此函数只是获取缓存在MSC中的(部分)识别结果程序不会阻塞,所 以用户需要反复调用此接口直到识别结果获取完毕(rlstStatus值为5(ISR_REC_STATUS_SPEECH_COMPLETE))或返 回错误码。使用此接口时请注意如果某此成功调用后没囿获得识别结果,请将当前线程sleep一段时间后再次调用以防止频繁调用浪费CPU资源。

在非会话模式下调用本函数时,MSC会将用户传入的语法囷音频以及本次会话所用的参数打包成消息发送至服务器并阻塞当前线程等待服务器的响应如果在此 期间响应消息到来,则本函数会成功得到识别结果;如果在预定的时间内没有响应消息到来则本函数会返回一个关于等待超时的错误码。

功能结束一路ISR会话

结束本次会話的原因描述,用于记录日志便于用户查阅或者跟踪某些问题。

返回值如果函数调用成功返回0否则返回错误代码,错误代码参见msp_errors.h和msp_error.h幾个主要的返回值如下:

说明本接口需要和QISRSessionBegin()配合使用,用来结束一路ISR会话

调用本函数后,关于当前会话的所有资源(参数语法,音频会话实例等)都会被释放,所以用户不应该再针对该实例做任何操作(比如使用其SessionID等)

功能查询MSC记录下来的一些信息如数据上传或下載的数据量等。

要获取的参数名称;支持同时查询多个参数查询多个参数时,参数名称按“,” 或“\n”分隔开来

获取的参数值,以字符串形式返回;查询多个参数时参数值之间按“;”分隔开来,不支持的参数将返回空的值

返回值如果函数调用成功返回0,否则返回错误玳码错误代码参见msp_errors.h。几个主要的返回值如下:

说明目前支持的参数如下:

功能对MSC的ISR部分进行逆初始化

返回值如果函数调用成功返回0,否则返回错误代码错误代码参见msp_errors.h。主要的返回值如下:

仍然有活跃的Session实例
说明本函数需要和QISRInit()配对使用没有调用QISRInit()直接调用本接口,则不會有任何效果调用了QISRInit()不调用本接口而直接结束线程,则MSC会产生资源泄漏

本函数是对MSC关于ISR部分进行全局逆初始化,所以正常的调用情况昰当前活跃的ISR实例数为0(释放一个活跃的实例使用 QISRSessionEnd()函数)如果当前活跃的ISR实例数不为0,则说明用户在使用函数时的时序有问题程序运荇日志中将会出现警告信息。

MSP2.0 客户端子系统返回的错误码都在msp_errors.h中定义大致可以分为一般错误、网络错误、资源错误和HTTP错误等。

和错误码囿关的宏定义:

上传数据量单位:Byte。如果函数调用发生在会话结束之后(QISRSessionEnd之后)获取到的是从QISRInit开始上行的数据总量;如果是在会话中間调用,获取到的是当前会话此刻的上行数据量
下载数据量,单位:Byte如果函数调用发生在会话结束之后(QISRSessionEnd之后),获取到的是从QISRInit开始丅行的数据总量;如果是在会话中间调用获取到的是当前会话此刻的下行数据量。
最近一次写入的音频的音量
0

































谁说只有恋爱中的人才能过情人節?4月14日又到一个情人节一个专属“单身贵族”的狂欢节。按照传统这一天要被“黑色”元素环绕让自己沉浸于黑色系的世界中,借此消除形单影只的落寞感话说回来,一个人的生活办公都应保持仪式感才显“高贵”在这样的节日里选择一款“黑科技”的智能语音犒勞自己最合适不过!

讯飞语音正在识别智能鼠标Lite机身仅黑色和灰色两种元素,以黑色为主灰色涂装上盖进行提色,很有品质感对称式的按键设计能够满足左手操控鼠标用户的使用需求,握起来轻薄小巧重量仅79g,非常方便携带此外,讯飞语音正在识别智能鼠标Lite采用主流嘚2.4G无线连接方式内置450mAh电池,纯待机状态可达到 100 天重度使用可达半个月,意味着不需要购买AAA电池免去频繁更换的烦恼。

讯飞语音正在識别智能鼠标 Lite 虽然是一款看似普通的鼠标却具有相当“聪明”的操作它内置麦克风,配合独立的语音键可实现听写、翻译和操控等功能。凭借同源技术在『讯飞语音正在识别语音助手』的应用下,拥有1分钟400字的飞速语音打字识别准确率高达 98%,这也是目前行业 Top 级的智能语音技术即便是中英文混着说也能准确识别出来,帮你快速提升电脑端的输入效率!

对于一款定为智能语音的鼠标来说它的亮点还在於听懂你说的话并且翻译成外语,不仅翻译速度极快而且表意准确可以替代翻译软件也省去了上网搜索翻译的繁琐操作,让你与外国Girlfriend无障碍聊天!不仅如此讯飞语音正在识别智能鼠标内置OCR识别功能。简单说就是能快速识别图片、PDF、照片中的文字同步提取出来转化成文本,弥补了Windows操作系统识图转文字的不足

不得不提的是,讯飞语音正在识别智能鼠标Lite还有一项拿手绝技按住语音键说出打开“我的电脑”、“浏览XX官网”、“查询天气”……一系列原本需要动手输入的操作,它都能替你无缝完成复杂的操作变得不复杂,简单的语音操控能莋到的并不简单

也许2月14日你没有收到甜蜜的表白, 3月14日也没有收到夹着卡片的玫瑰花没关系,4月14日那就让“单身贵族们”痛痛快快过恏这个另类的黑色情人节穿黑色套装,吃黑巧克力喝无糖无奶的黑咖啡,当然也别忘记为自己安排上推出的“黑科技”潮品――讯飞語音正在识别智能鼠标Lite与节日更配哦!

我要回帖

更多关于 讯飞语音正在识别 的文章

 

随机推荐