帮我小学生对主席说两句话语音:这样可以了吧? 说什么呢? 分开录 谢谢啦!

为啥你总是抢不到微信里的语音红包?
· 265 天前 · 15888 次点击
文章尾部加了小小的广告,介意的可以关掉帖子了
总也抢不到的红包
一切都源自于一个红包,下午,朋友发消息给我说,让我领个红包。
打开后,看到红包,我不禁笑了。想我国家普通话水平等级测试一级乙等的水平,岂会怕一个小小的语音口令?
我清了清嗓子,以纯正的“播音腔”,念了“四十是四十,十四是屎拾”,小程序冷笑了一声,返回给我了个“再接再厉,再录一次”。
我以为是自己没说好,站起身,气沉丹田,再次念了一次“四十是四十,十四是屎拾”,旁人纷纷对我传来了异样的眼光.....然而异样的眼光也并没有
我灰溜溜的走出房间,找了一处无人的地方,一次次的尝试去读“四十是四十,十四是屎拾”。然而努力是没有结果的,每次都是武功而返。
“我要说口令”背后的秘密
既然无法抢到红包,气急败坏的我开始想,为什么我这么纯正的普通话,还抢不到红包?
作为一个普通话一乙的北方人,如果我都领不了红包,岂不是只有一甲的播音员们才能抢到?问题肯定不在此。于是,我开始动用我身为程序员的本能,开始分析小程序背后的技术。
终于,我想到了,它之所以能够做到读对口令才能抢到红包,完全是依赖于背后的一项技术——“语音识别”
什么是语音识别?
语音识别背后有非常多的技术,我这里尽量简单的给你说明什么是语音识别。
首先,用户在 App 中按下按钮,录制语音,然后 App 会将音频上传到后台的服务器,后台的服务器对声音进行特征提取,传递给下个阶段的处理器,这个时候,我们的声音信号已经由声音信号转变为处理后的特征信号。
然后处理器再通过接入 **“声学模型”,来获取不同的特征信号可能代表的字词;再由“语言模型”**,实现对所有可能字词的选择,得出最可能的结果。
最终,经过一系列的处理,我们说话的一段语音信号,就变成了一句话 “你今天吃饭了么?”
英语流利说的语音识别
英语流利说的语音识别功能是非常厉害的,就如其广告中所说“会打分的人工智能英语老师”,英语流利说的依仗,便是其比别人更加优秀的**”声学模型“和”语言模型“**
学员在手机上录音,录音经过上传,到云端进行特征提取,再由“模特声音训练过”的**“声学模型”进行处理(这里的模特声音训练过非常重要,训练材料的不同会导致模型的天差地别),声学模型处理过后,文字会传递给语言模型,组合成句。在完成两处处理后,对声音信号和文字信号进行打分,如果你的准确率比较高,你就能够获得一个Nice !**
语音上传部分我打了问号,是因为流利说本身也有离线打分引擎,所以可能我们的语音没有上传到云端,在本地就直接进行处理了。
更细致的信息你可以到 去看,林晖先生解释的很细致。
“我要说口令” 如何实现读口令抢红包的功能?
由于“我要说口令”小程序本身的功能要比英语流利说更为简单一些,不需要进行特殊模型训练,可以借助一些云计算服务商提供的 API 来实现功能。这里,我们拿“阿里云 ET 智能语音交互”服务 来举例。
此处仅代表我个人针对“我要说口令”小程序的分析,不代表其官方架构。
小程序在手机上进行录音,然后将录音上传至开发者的服务器,服务器上的后台程序再将声音信号通过 API 传递给** 阿里云 ET 智能语音交互,并调用其中的 智能语音识别接口,接口对语音信号进行处理后,返回识别的文字**,比如在刚刚那个红包中,识别出来的文字是“四十是四十是四是屎拾”。开发者的服务器在受到服务器传回的文字后,和发红包的人设置的文字对比,看看两个文字是否相同。如果文字相同,就说明读对了,用户就可以拿到红包;如果文字不同,就要告诉用户“再接再励”了。
当然,实际上在对比的标准中可能不会这么简单,因为在这种情况下,声学模型和语言模型识别出来的文字可能会非常奇葩,用户能够匹配上设置的文字的可能性就会非常小,这时,程序员可能就会在这方面设置一个“冗余度”,如果内容中有 80%的文字是对的上,就能拿到红包。
这个红包,我不要了!
想到这里,我不禁悲从中来,由于“声学模型”和“语言模型”的性能,计算我读的再好,可能也无法被很完美的识别出来。特别是这种几乎是无序的内容,语言模型根本无法很好的处理,我总是抢不到红包也是正常的了。以我的运气,这辈子怕是都抢不到语音红包了,我还是去群里抢普通运气红包吧!
不过,虽然我不能抢红包,但是我可以去做一个抢红包的小程序!有了“阿里云 ET 智能语音交互”,无需自主建立语音识别的系统,轻松实现语音识别!
阿里云智能语音交互地址:
写在最后:
谁认识阿里云的语音交互的运营小姐姐,帮忙问问,我这么卖力,给我个鸡腿吃好不好!
第 1 条附言 &·& 264 天前
补充解释:
为什么一乙也无法抢到红包?
即使你的普通话是一甲,但是你无法保证你的声音特征在语言模型时组合出目标文字。这种红包如果想让别人徒劳无功,最好的办法是输入无序的字符。有序字符在读完以后是比较容易根据语境生成对应的字符的。无序字符或者故意替换以后,语言模型生成对应字符的可能性就大大降低了。如果不设置冗余度,这玩意特定词句下的中奖几率可能还不如彩票。
希望大家可以多提问题和建议,这样我可以把科普文章写的更好
13 回复 &| &直到
12:26:24 +08:00
& &265 天前 via Android
除了广告,并没有看懂你说的是啥
& &265 天前 via iPhone
如果说太多会不会变成语音训练?再和个人手机号绑定生成语音打电话………
& &264 天前
@ #1 大致讲了下什么是语音识别,你觉得哪些段落开始看不懂的?我开始做技术的布道,所以还是想获取来自您的反馈,谢谢。@ #2 你说的太多不太可能变成语音训练,因为你说的话虽然有了数据,也就是训练的训练级,但是没有具体的指标来评估和规范。如果无法规范就不可能生成属于你的基准声音。
& &264 天前 via iPhone
@ 不对,应该叫科普文。你是不是觉得诸如“声学模型”,“语言模型”那里不好懂?
& &264 天前 via iPhone
同音字太多了,屎有可能识别成使
& &264 天前
还是没能解释为啥一乙普通话抢不到啊?结论是脸黑?
& &264 天前
我就是进来看看有没有红包直达二维码的
& &264 天前 via iPhone
@ 是的@ 就是 5 楼的意思。即使你的普通话是一甲,但是你无法保证你的声音特征在语言模型时组合出目标文字。这种红包如果想让别人徒劳无功,最好的办法是输入无序的字符。有序字符在读完以后是比较容易根据语境生成对应的字符的。无序字符或者故意替换以后,语言模型生成对应字符的可能性就大大降低了。如果不设置冗余度,这玩意特定词句下的中奖几率可能还不如彩票。
& &264 天前
看开头,以为是包你说这个小程序的广告到了中间,以为是英语流利说的广告到了最后,才发现是阿里云的广告
& &264 天前 via iPhone
& &264 天前 via Android
这个红包有点 zz 了?应该用和流利说一样的技术,只比对音调特征而不是翻译成文字再比
& &264 天前 via Android
调用电脑的 text to speech 不就解决了?
& &264 天前
@ #12 没用的,你过得了声学模型过不了语言模型。@ #11 应该是有冗余度的,不然红包太难抢了。不过对比特征不太现实,因为这种手动输入的没有音源,鬼知道用户会输入个什么奇葩的字,比如“鐖掱(qipa)”
& · & 694 人在线 & 最高记录 3762 & · &
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.1 · 24ms · UTC 18:31 · PVG 02:31 · LAX 11:31 · JFK 14:31? Do have faith in what you're doing.网页版学习工具
在沪江关注的沪友遇到了一个关于的疑惑,已有人提出了自己的看法。
知识点疑惑描述
知识点相关讲解
暂无知识点相关讲解
其他相关知识点
暂无相关知识点如何区分多普达575的行货和水货 - 中国广告知道网
为了能够更快的帮助网友解决“如何区分多普达575的行货和水货”相关的提问,中国广告知道网通过互联网大数据对“如何区分多普达575的行货和水货”相关的解决方案进行了整理,用户详细提问包括:如何区分多普达575的行货和水货与之相关的答案,具体解决方案如下:
提问者悬赏:77分 发布者:匿名网友
提问时间:<font color="#FF-01-16 18:08:35
详细问题描述及疑问:本人想买一款多普达575,但是经过了解发现多普达575的水货射频问题没有的到解决!因此想买行货,但是因为不懂得区分,担心被JS欺骗!所以希望各位前辈指点一下!期待您的答案,滴水之恩,来日我必当涌泉相报!
第1个回答:
想大声说爱你
行货的叫多普达,水货都是帖牌的,有O2,Orange等等。。。看标志就可以区分。参考**:www.aryaya.com
|||||||||||||
猜您感兴趣
热门搜索:
本页网址:荣耀8打电话给他人 他人听不到我说话的声音 但是录音以及语音什么的都
按时间排序
本地录音功能都这样,如果你要经常用的话,建议你下载一个专业的录音软件,比如“移动公证”提供手机端的:电话录音、现场录音、现场录像、拍照取证、存证和公证管理服务。而且存储云端!!!高效安全。用电脑登陆随时取存转发。。希望对你有帮助。
应该是信号的问题或者是卡到了
我现在和你情况一样,现在好了吗?必须去售后吗?
推荐使用360手机,性价比高。
我也是这样,求答案
感谢您为社区的和谐贡献力量请选择举报类型
经过核实后将会做出处理感谢您为社区和谐做出贡献
确定要取消此次报名,退出该活动?
请输入私信内容:我想给我录制的视频添加一句语音,添加一句说话内容?用软件操作呢?_百度知道
我想给我录制的视频添加一句语音,添加一句说话内容?用软件操作呢?
&#xe6b9;答题抽奖
首次认真答题后
即可获得3次抽奖机会,100%中奖。
小新只看视频知道合伙人
小新只看视频
获赞数:41
推荐使用拍大师,“视频编辑”里面的“配音”功能就能添加语音了,操作超简单的,可以随意调节音量大小。&
laowu20121知道合伙人
laowu20121
采纳数:5996
获赞数:14971
用《会声会影×5》暨15.会声会影是非常受欢迎的视频编辑软件,简单易用但功能却非常强大。使用会声会影能够轻易地制作出非常有特效的视频,网上很多DV作品其实就是使用会声会影制作而成。它还是将视频、音频、图片、动画、字幕编辑合并制作电影或电子相册的好帮手哎。软件操作简单,很容易上手。软件自带许多模板,套用现成的片头片尾模板,插上你的视频(可以剪切、合并)视频、图片。既可以保留原来视频的声音,也可配上你的画外音(录音)或音乐。特别是会声会影X5增加了不少的滤镜,其中的“画中画”功能,更使制成的MTV、电子相册或者电影艳丽多彩,达到专业级的视频。还可批量转换,在手机、mp4等移动设备上播放以及刻成DVD光盘(还可以刻录音乐、数据光盘);编辑高清视频(包括部分3D高清)输出高清视频。如需要软件(免费破解版)与教程,请留个邮箱
风紫KEN知道合伙人
获赞数:24
操作看下图!
为你推荐:
其他类似问题
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。

我要回帖

更多关于 主席我想对您说两句话 的文章

 

随机推荐