目前传统的语音识别输入识别技术就是把声音转换成文字,但是对于声音不清晰的情况正确率非常不理想,后来偶然发现“录音啦”这个软件里面还有视频取字幕功能,直接把我们正在观看的视频字幕提取出来并可以实现同步翻译,这个功能有点厉害
视频取字幕,这个功能 youtube 早就有了根本不需要安装第三方来历不明的软件
没有的,你说的那种是把视频上传到YOUTUBE然后自动翻译,和这个方式完全不一样
反正不开放源代码的,非知名厂商开发的特别是国产软件(含汉化或者国内代理的),需要下载apk exe等等才能运行的不管有什么婲里胡哨的功能,一律拒绝使用就对了
苹果最近正在申请一项通过判定哋理位置来提高语音识别输入识别准确率的技术专利.通过结合地理位置信息,苹果可以更好地向用户反馈例如周边商业服务或者街道名称等信息.
苹果正在申请的专利阐述:"随着语音识别输入输入信号越来越复杂多样,如何提高其准确率已然是一项挑战.而这在特定方言区或者特定地區的表现尤为明显."在语音识别输入输入时,系统常常无法正确识别讲话者究竟在讲当地方言或是正在提及周边的一个地理位置名称.为了避免混淆,可以通过特定的词组来判断其是否为地名.
例如,有人在语音识别输入识别中提到了Goat Hill(山羊山),以往的语音识别输入识别技术常常会将其理解為Good will(好意),因为原词组的使用频率极低.若应用融合了地理位置的新技术,系统可分析出讲话者其实是指自己周围的一个名叫Goat Hill的酒吧.
很多种语音识別输入识别软件,包括苹果的Siri,都提供地域方言选项.若应用此项专利,其将大大提高识别率