金熙秀 / 全部文章 / 正文

淼怎么读【科学】语音“喝茶”的艺术:往事回味Laurel还是Yanny-语言研究

by admin on 2014-08-14

【科学】语音“喝茶”的艺术:往事回味Laurel还是Yanny-语言研究

九月是个入学的季节,随着新一波的孩子们进入各个高校的实验室和研究所,我们的语音家庭也迎来了众多渴望知识的小朋友们淼怎么读。作为大朋友,自然是乐意带着好喝的茶水来招待。不管是茶还是咖啡南郑天气预报,你都会用过一个小小的网状物品爬书网 ,这个网状物品让你又爱又恨——爱在它阻隔了茶叶对口腔的造访,恨在接热水的时候总会因为水流不过去而导致烫到自己。
我们的语音也是这样,在气流从肺部冲出,引起声带振动的时候顾珊珊,它就像杂乱无章的噪声。我们之前曾提到过共振,它是在我们的腔体里产生(口腔、鼻腔、咽腔)天舒工作室。这些腔体就像是茶叶的滤网,它严格把关声源声波,对其层层选拔过滤温大教务处,才调节出我们说出来的声音。用praat显示的语谱图,也和这个过程紧密联系。这样的一个过程,我们成为滤波,而实现这一过程的那个“网”医指通官网,我们可以叫做滤波器(filter)巨大化入侵。接下来,我们就好好说道说道这个东西到底是怎么样的情况。
Chap. 1
并不“纷繁复杂”的种类
在提到一个新事物的时候,我们肯定要对它的类型进行划分真凶难逃,只有这样,我们才能了解到哪些是它哪些不是它。滤波器可以从字面意义上理解出来,就是过滤波的器具,这个“波”可不单单指我们的声波,波的类型也有很多,我们就不再说远了,我们主要说声学滤波器(acoustic filter),一般我们会碰到的主要有三类:低通滤波器(low-pass filter)、高通滤波器(high-pass filter)和带通滤波器(band-pass filter)。看到这里可能会有人惊呼:“这在praat上面见到过!”没错,praat上的filter就是来执行这个功能的。我们一一拆开来讲。
*低通滤波器示意图
从字面上其实可以理解出来,所谓“低/高通”,就是允许低频或高频信号通过。比如途中表示的是一个低通滤波器的示意图,它允许300 Hz以下的通过,以上的被滤掉。我们把允许通过的部分叫通带(pass band),即图中白色的部分;不允许通过的地方叫阻带(reject band),即图中灰色的部分。而那个允许通过的最大频率,叫做截止频率(cut-off frequency)。类似于茶网里,我们用一个网孔小的放在杯子上,让茶叶末滤过去(不要在意“为什么有人喝茶叶末”这样的细节,我们在此只是举例)空中超市,而大个的茶叶被留在了网里没有到杯子里。高通滤波器则与低通滤波器正好相反,它允许频率高的通过,把频率低的阻隔出来。

*带通滤波器示意图
了解了低通和高通,有人就会想,孟照国我想要一个区间内的声波,其余的我想过滤掉,那么带通滤波器的作用就显示出来了。带通滤波器就像是低通和高通的整合相加朱琦郁,为了方便定义带通滤波器一眉道长,我们需要引入中心频率(center frequency)和带宽(bandwidth)两个概念。尤其是带宽,语音学学生听到它的频率不亚于采样频率。从图中可以看到,中心频率其实就是峰值对应的频率,带宽则是由峰值往下数3 dB时的宽度,通过这两个我们可以定义一个带通滤波器了。
Chap. 2
热门的Laruel和Yanny
我们提到了这么多滤波器,那么它的用途在什么地方?我们从今年火爆一时的语音听辨的小故事谈起滤波器的功用。在今年上半年,各个语言学群和朋友圈被刷爆的一个问题就是:你听到的是Laurel还是Yanny?就如同裙子的蓝白之争一样,这段音频也引发了两个派别的对立,当然也有中立派表示两个都能听到。
因为这是很典型的语音感知问题,它可以从滤波器的角度出发。我们都知道,我们对元音的感知主要依赖于第一共振峰F1和第二共振峰F2恐怖秀 ,它承载了一个元音的绝大多数信息热血仙境。那么,我们尝试使用一个截止频率为1300 Hz的低通滤波器,重新打开可以看到它1300 Hz以上的频率都被过滤掉了,这时候你听到的会是什么呢?这个就留待大家自己去探索了。
*截止频率为1300 Hz的低通滤波后的语音
总而言之,通过滤波器,我们可以过滤掉我们不需要的声波信息,留下需要的主要内容,这样可以为我们的分析提供诸多的便利。
Chap. 3
自己泡茶与时光倒流
我们回到文章最开头提到的,肺部气流冲击声带引起振动,产生嗓音,经由腔体的滤波和共振作用邱思婷,才会有我们丰富多彩的语音。那假如,我们把整个过程“倒”过来,是不是意味着我们可以得到一个声音的原来嗓音声源的情况?答案是肯定的,许多前辈学者也对此有很浓厚的兴趣,因为嗓音声源与我们的发声态(phonation)紧密联系,这样的过程我们称为逆滤波(inverse filter),经过逆滤波可以去掉共鸣特性,只保留声源特征。
*孔江平《论语言发声》逆滤波示意图
又或者,我们有个嗓音声源,我们能否把它变成自己想要的语音呢无限星辰?答案也是肯定的,只要我们确定滤波的主要特征,就可以把一个嗓音声源变为你想要的语音,这个某种意义上算是语音合成的小过程,我们可以从Klatt语音合成器开始做起,它实现的是一个简单的FIR滤波器张闾琳。在MATLAB中使用fir函数即可实现这样的功能,下图就是一个简单的/i/的合成。可以说,学会了滤波器,你就算是掌握了一项非常了不得的技能李九鸣。
*元音/i/的合成示意
1
参考文献
孔江平(2001).《论语言发声》,中央民族出版社
Johnson, K. (2011).Acoustic and Auditory Phonetics. New Jersey: Wiley-Blackwell
Rabiner, L. R. & Schafer, R. W. (2010). Theory and Application of Digital Speech Processing. New York: Person Press
Stevens, K.N. (2000).Acoustic Phonetics. The MIT Press
你希望奈提柯斯先生介绍哪些语音学的内容?或者有哪些不理解的语音学的小知识?欢迎后台留言或评论告知,我们会安排相关语音学背景的人科普,一起在语音学的领域中进步。
本文原题:语音“喝茶”的艺术


52

« 河北省自学考试成绩查询【积累】——人生的成长信条-矩形财富社

物体的内能【科普】原来屈原不姓屈,你知道吗?-眼镜行业正能量平台 »