二、什么是发声态?
蓦然回耳,那音却在声带嘶裂处(朱晓农)
3.1.发声态到底是乜鬼?
发声态指的是说话时声带活动的各种状态,通常所说的‘清音’‘浊音’如p~b,两者的区别就是所谓的‘发声态’区别。
‘清音’‘浊音’在发声态系统中分别属于两大类:‘清洌声I’和‘清洌声II’。这两大发声类是最常见的发声态,所以称为‘常态/常规发声’。它们在听感上是一种清洌的嗓音。
与此相对的是‘非常态/非常规发声’或‘特殊发声’,包括假声、气声、嘎裂声等。它们在听感上是非清洌的嗓音,或有尖声嘶厉感,或有浑浊、断裂感——正如题记所说:‘那音却在声带嘶、裂处’。
发声态可以从两个角度来定义和分类。上面两段话说的就是从生理学角度来定义的生理发声态。
另一个角度是从音法学(首先是音节音系学)角度来定义的音法发声态或音节发声态(这两个是同义词)。2.3节图6的音节结构显示:发声态是声域的语音实现,就像元音是韵母的实现,声母实现为辅音一样。而声域则是音合的下属成份。
声母韵母作为音合的下属成份是有时间先后的,所以叫线性成份。声合的下属成份声域、音高等是可以跨音段的,可以从声母蔓延到韵母,所以叫非线性成份。
因此,生理发声态和音节发声态的最大区别在于:生理发声态是专属某个音段的,是从音素角度来研究的。音法发声态则是整个音节的属性,会影响多个音素以及声调,尽管有时在某个音素上表现得更显豁点。例如音节学中的弛声,即所谓‘清音浊流’,我们不能说它是声母清声,而韵母是振声——这在音节学中就不知所云了。过去一直没明白这道理,以为从生理语音学到音法学就一条线直接对应,所以一直理不出个头绪。
下面先简单介绍生理发声态,然后详细介绍音节发声态。生理发声态中的名词保留习惯所用的如‘带声’‘不带声’等,但音节发声态中的术语用了很多新的,如‘清洌声I/II’‘振声’‘浊声’(=带声或不带声的气声,但≠单纯的常态带声)等。我知道,用新术语很惹人讨厌,尤其是对我这样的老头儿。但问题是新概念实在没办法用旧瓶装新酒,否则误导了新进,那还不如不要了。
3.2.什么是生理发声态?
对发声态的研究始于半个世纪前(Catford,;Laver,)。最早卡福从喉门收缩部位和收缩程度两个维度分出23种生理发声态。二十年前赖福吉等(LM)从语言中出现的发声态辨认出八种生理发声态。
3.2.1.单一发声态有哪些?
生理学上有六种单一发声态:振声、假声、嘎裂声、喉闭态、喉开态、耳语声。前三种(振/假/嘎)是振动声带的。发振声时声带正常振动,纵向、中部、内收三种紧张度都处于中性状态,不太紧也不太松。假声则性质完全相反,都处于高度紧张状态(Hollien:),声带抻得很长很宽,内沿拉得极薄,声带绝大部分不振动,只有沿着内缘一带振动。声门常常处于微开状态,而喉下气压一般低于常态振声。但由于仅有声带薄薄的内沿在振动,所以所需气流并不太多。假声最显著的声学特征就是超高频率。据HollienMichel(:),男性假声的音高范围平均为-赫,而振声的平均声域为94-赫,包括各种场合。据我们对具有语言学功能的假声的测量,男性读字表时假声范围在-赫,女性最高超过赫兹。发嘎裂声时声带不是像发喉塞音那样往两端拉紧,而是往中央收紧。声带收缩得又短又厚,大约只有振声的三分之二长短。中央收缩和外展紧张度都极高,喉门后部两边的杓状软骨紧闭,并紧拉住声带后部。声带从后部到中前部大部分都不振动,只有前部一小段漏缝,气流很小,溢出时振动这一小段的声带。由于声带厚实僵硬,所以带嘎裂声的音频极低,远远低于发音人本人正常频域的低限。有时低到只有三四十赫。声带振动时很不规则,基频也很不规则。
另三种发声态(喉闭态、喉开态、耳语声)是不振动声带的。喉闭态即声带处于静止状态,包括由声带纵向紧张度较高而形成的喉塞状态——喉塞音。耳语声跟喉开态的区别是后者声门全开,而耳语声只打开后面的软骨声门,韧带声门是关闭的。从音法学角度看,不论单用,还是和别的发声态一起构成复合发声态,耳语声都不跟喉开态对立,所以把它合到喉开态中。
除了喉闭态,其他单一发声态可以组合起来构成二十来种复合发声态,大多没有音法学意义(朱晓农)。它们表示的是副语言学特征,比如不同的感情色彩(咆哮、尖叫、嗲声嗲气等),或个人的嗓音特征(沙哑、沉闷、声如洪钟等)。具有音法学意义的复合发声态只有少数几种,如喉开态加振声构成气声、嘎裂假声(声素系统中叫嘎裂张声)。
上一节中提到两个更概括的概念:常态发声(常态嗓音的听感)和特殊发声(特殊听感)。常态发声指振声和喉开态,发声时声带处于中性状态、或放松打开状态,嗓音清洌。特殊或非常态发声包括嘎裂声、假声、喉闭态、气声,发声时声带(某一部分)特别紧张或松弛。
以上所论都只是生理发声态,它不能直接对应于音法学中的发声态。此外,生理发声态只考虑了声门水平活动和某个时间点的形态,如果考虑垂直活动以及时间延续,那么还会形成更多的音法学中的发声态。
3.2.2.VOT有什么用?
起振时VOT的全名是振声起振时voiceonsettime。起振时定义的是一个时间跨度,以爆音的除阻时为原点,量度振声发出的时间:VOT=爆发时–振声初发时,以此区分传统的三个发声态:振声、清不送气、清送气。如果振声发出在除阻之前,那么VOT是负的,表示是振爆音。如果振声发出在除阻之后,那么VOT是正的,这是清爆音。如果这个正值在0~30ms之间,表示清不送气。否则为清送气。后文音节发声态还增多一个弱送态,VOT在30到60ms之间。所以音法发声态中的清送态的VOT60。VOT达到一百三五十毫秒,就是强送气了,不过强送气不是独立发声态。这些数值都是经验值,正负上下有一二十毫秒出入。
起振时值还是其他一些参数的函数,例如同样是不送气:(1)调音部位不同VOT也不同,被动部位阻碍点靠前如p,t,VOT起振时值就小,部位靠后如k,起振时值就大,可能20甚至30毫秒。(2)成阻部位接触面越大,VOT越长;(3)调音动作越快,VOT越短。
起振时的概念40多年前提出时很有一番雄心(LiskerAbramson),以为找到了一个统一的参数来描写所有爆音。但其实它只能度量常态发声,更多类型的特殊发声如气声、弛声、嘎裂声、假声等都不以起振时来区分。对于浊送气爆音如b?ú来说,起振时的概念不适用,因为它的起振时也是个负值,跟振声b没什么区别。还有一类辅音与气流机制有关,如内爆音、喌音、喷音,起振时的概念也没用(cf.朱晓农a)。当然,清振和送气与否是爆音最常见的两对特征,据此能区分世界语言中最常见的三类爆发音。对于发声态简单的英语或者汉语官话来说,起振时是个简明有效的参数。但是对于很多方言和民族语中的发声态和气流机制多样化的各类爆发音,VOT作用就很有限,所以我们就需要用一个全面的发声系统来进行音系内部描写和跨语言比较。