北京话上声调研究：基于语音声学信号和EGG信号的考察最新章节_刘志敬著

1.4　以往的上声实验研究

关于汉语声调，历史文献多有记载。南朝齐梁时代的沈约等首次揭示了汉语的声调系统由平上去入组成，提出了“四声说”。但什么是声调，其特点是什么，该如何来描写，该如何分析，一直是一个难题。唐《元和韵谱》、净严《三密钞》，明释真空《玉钥匙歌诀》、王骥德《曲律·论平仄》，日本释安然《悉昙藏》“定异音”、释明觉《悉昙要诀》，朝鲜崔世珍《四声通解·翻译老乞大朴通事凡例》等文献中虽有描写，但多语焉不详，很难把握。近代由于科技进步，学界有条件将分析发音生理的医学器械以及能测量、分析声音的物理仪器应用到语音的研究上，对声调的科学认识才开始起步。汉语声调的实验研究始于刘复先生，他的《四声实验录》是中国第一部实验语音学专著。书中使用浪纹计测量了北京话4个声调的基频参数，画出了基频曲线的形状及频率范围，得出声调的实质是声音频率的高低的结论。（刘复，1951）从此，对声调的研究从口耳听辨转而重点放在用实验的方法研究基频模式上。近年来，现代言语声学和医学理论证明，语音的产生主要分成两个部分：一部分是共鸣，另一部分是声源。（孔江平，2001）要想揭示声调的本质，必须要关注声调的发声研究。北京话上声调也经历了从单纯重视基频模式的研究到同时关注上声调的发声特点这样的过程。

上声是四个声调中最受人瞩目的一个声调。它既是四声中唯一具有稳定低音特征的声调，也是单字调里唯一的一个曲折调（凌锋、王理嘉，2003）。或许因为这个特点，从20世纪早期开始到现在，对北京话四个声调的实验研究中，结果分歧最大的就是上声。

1.4.1　基频模式研究

刘复先生在《四声实验录》中使用浪纹计测量了字音基频F0，并研究了其变化规律，得出声调的实质是声音频率的高低的结论（刘复，1951）。林茂灿（1988）用实验证明：普通话声调的最本质成分是基频音高F0。对应于上声，人们多由从言语声学信号提取基频，研究其高低及其调型变化来着手。声学研究上多关注上声的调值和调型，知觉研究上多从起点音高、拐点音高、拐点前后位置、终点音高等特征点出发考察对感知的影响。

1.4.1.1　基于言语声学信号的基频模式研究

上声经常被描述为“曲折调”。赵元任首创了五度制声调符号，第一次用类似音乐音阶的方式形象地描绘出了上声是一个降升调（赵元任，1922；白涤洲，1934）；还有人认为它是升调（Bradley，1915；刘复，1951）；后来赵元任先生又提出“半上”的概念，并认为上声在多数情况下是21或11，低降或低平（赵元任，1932、1933）。王力先生进一步提出：“北京话的上声基本上是个低平调，调头的降、调尾的升，都是次要的”“‘半上’实际上是个低平调”。（王力，1979）此后，关于上声的调型和特点一直就存在争论。

1.上声曲折调说　凌锋、王理嘉（2003）通过重新探讨“半上”和“上上变调”问题，指出上声的深层形式是个低的曲折调（214），无论是在哪种变调情况下，这个深层形式始终在发挥作用；杨洪荣（2008）分析了方明、于芳两位播音员单音节词语朗读材料，指出上声最常见的调型是曲折调，方明的调值为213、214、223、224、313、324，均值为214，于芳的大多数调值为214，有四分之一的读为314、313；曹文（2010）指出从语音材料及一些发音-声学实验的研究结果来看，很难观察到又低又平的上声，低平调22、11的感知具有一定的语境依赖性，北京话的上声基本上是个低平调，这种说法至少从语音学的角度来说是不对的，至于所谓半上，充其量只能说可以是个低平调；韦丽平（2012）从一男一女两位北京人发的/i3/、/i1/变成平升调、降升调、降平调、降平升调等不同的调型来观察，结果发现平升调、降升调和降平升调与T3拟合度较高，听辨率高于其他三个调型，并且出现了听辨率为100%的声音样本，而这三种调型中，合成降平升调的T3听辨率显著高于其他两种调型，说明从调型上来看，“理想的上声”须是一个“凹”调，必须有“降头”和“升尾”，而并非如王力先生所说“调头的降、调尾的升，都是次要的”，且低端须持续一定时长。

2.上声低平调说　金立鑫、白水振（2011）提出了要“彻底改变传统上声教学的方法，改而采用低调作为上声的基本调位”的观点，认为上声在实际语流中典型的特征是一个低调，而曲折调是上声的一个条件变体。他们从音高的对立关系入手提出：阴平（高平调）与上声（低平调）对立，即高低对立；阳平（由下往上的升调）与去声（由上往下的降调）对立，即升降对立。并说，从以上可见，王力先生的说法“已成为海外汉语教学实践中较为流行的一种观点”，被广大的对外汉语教学界所认可。

总而言之，支持上声是曲折调的人认为上声除了具有低这个特点外，降头和升尾也是必需的。支持上声是低平调的人认为对于上声来说最重要的是拐点位置的低平，弯头的降和调尾的升都不重要。这两种观点的争论还一直在持续。

石锋、王萍（2006a、2006b）在前人研究的基础上，跳出调型的局限，以52个发音人的大样本数据对北京话声调进行了全面的描写和统计，得出了很多我们可以借鉴的结论：

1.区分了上声调的稳定段和动态段。石锋、王萍（2006a）运用语音实验的方法，采集不同发音人全部单字调的测量数据，计算出上声调的平均值，并用T值公式对其进行归一化分析，发现上声调是主要位于调域下半部分的曲折调。它的特点可用“低”和“凹”来概括。在声调格局中，上声所占的不是一条线，而是一条带状的声学空间，其特点主要是“低”和“凹”，对应的五度值：上限314，中线313，下限212。上声的声学空间范围起点跨度较大，拐点跨度稍小，终点跨度最大。拐点处的数据分布向下集中，分布范围受到制约，多在调域底部，这表明“低”是上声最重要的特征。终点的数据离散性较大，大跨度分布表明它的高低对于声调的区分作用不大。石锋、王萍（2006a）认为上声的折点部分是上声中的稳定段，更多地承载着声调的调位信息，与其他调位相区分时发挥主要作用，因而其稳定程度高，变化的可能性小；认为上声的起点终点并非上声中的稳定段，离散程度较大，承载的调位信息少，与其他调位相区分时发挥相对次要的作用。

2.石锋、王萍（2006b）参照社会语言学的理论和方法，在北京话的单字音声调统计分析结果的基础上，分别按照发音人的不同性别、家庭语言环境和不同年龄，对语音样本分别进行了分组分析。每个曲线选取10个点。结果表明：男、女性的上声都是“低凹”的曲折调，起点和终点都是女性的基频值高，但拐点女性在下方，基频值低于男性，差异检验表明，只有前三个点表现显著，说明拐点和终点男女性差别不显著；新老北京人的上声也表现出“低凹”的特点，整体上新北京人基频高于老北京人，但各点的差异都不显著；新老北京人分别按照年龄分组统计，发现新北京人各年龄段四个调类在0.05水平上的总体差异程度均不显著，老北京人各年龄段只有上声调的第1个点在0.05的水平上总体差异显著。研究表明，北京语音也在发生着变化，只是这种正在进行的细微变化不易察觉。

1.4.1.2　基于知觉的基频模式研究

知觉研究中有人关注起点音高和拐点音高间的关系。Shen&Lin（1991）考察了汉语母语者对上声的感知，设计了两个不同的连续体。这两个连续体的起点（onset）音高与拐点（turning point）音高之间有差距：第一个连续体的起点音高与拐点音高相差30Hz，第二个连续体的起点音高与拐点音高相差15Hz，第一个连续体的辨认函数的边界比第二个连续体要早，研究者认为这可能是因为起点与拐点之间的音高差造成的。Liu（2004）在实验中使用了起点音高位置和拐点音高位置两个自变量，通过实验指出，对母语者来说当拐点时间较靠前时，起点音高需要更高才能倾向于辨认为上声；与起点音高相比，拐点前后位置对上声的感知来说更重要，具体来说：当拐点位于20%处时，上声的感知更倾向于依靠起点音高，而当拐点位于60%位置以后时，上声的感知对起点音高的依赖更少。有的学者关注拐点音高及拐点前后位置。沈晓楠（1990）认为，阳平和上声的区别在于降升转拐点发生的时间，也就是拐点的位置，阳平和上声的区别边界大概位于全部时长40%的地方，也就是说对于一个降升调来说，其拐点位于调长40%时，就比较容易被感知为阳平，而当其拐点位于调长40%后，就比较容易被感知为上声。Shen&Lin（1991）认为，上声的拐点平均时长在48%处左右。其实验研究发现，拐点位置在整个声调时长的60%到70%之后，刺激音被感知为上声。Cao&Sarmah（2007）认为拐点的前后位置会影响上声的正确感知。在言语刺激作为原始刺激材料的情况下，拐点位置位于整个上声的42.5%到72.5%之间。王韫佳、李美京（2010）发现拐点位置对阴平辨认率的作用不显著，对阳平和上声的作用显著，而且往往跟上声的起点音高和终点音高有关系。有的学者关注上声终点及其高度：凌锋、王理嘉（2003）认为上声“214”的4是很少出现的，一般也就是“212”；王韫佳、李美京（2010）认为上声的终点音高在自然语言中并不稳定，升尾甚至是可有可无的；王韫佳、覃夕航（2012）使用终点音高不同的三个降升调连续统分别进行辨认和感知实验，自变量为降升调音高曲线的音高拐点位置，指出：当拐点比较靠后，即下降部分时长够长的情况下，高终点使得上声的辨认率提高。

综上所述，学者们对于上声的争论点在于，起点、拐点、终点音高和拐点位置四个考察点对于上声来说哪些可以忽略，哪些是重要的，而且多围绕单个考察点来进行讨论。

北京语音是普通话的标准音，在日常交际中使用，与社会的发展息息相关，它是鲜活的，不是一成不变的，跟其他汉语方言一样处于发展变化之中。不管它的变化是否显著，我们都不能忽视它。从基频模式研究看，无论是声学的还是知觉的研究，研究者大都从音高和调型两方面入手。调型方面主要从拐点的前后位置等方面来考察；音高方面学者们大部分认为“低”是其重要的特征，重点从起点音高、拐点音高和终点音高以及它们间的关系来考察。学者们的研究表明这三个点所负载的调位信息不同：拐点是由离散度较小的测量点构成的稳定段，更多地承载着调位信息，而起点和终点作为非稳定段负载的调位信息少，但它们一起构成了上声的不可缺少的考察点。本书拟从北京人的社会身份背景以及上声的古来源等角度来考察当代北京话上声的基频模式，即起点、拐点、终点及拐点位置等方面的变化。

1.4.2　发声研究

北京话上声调嗓音信号的研究主要集中在两个方面：一是上声“低”的发音特征在发声态上的显现—嘎裂声的研究；一是上声调发声模式的研究。

1.4.2.1　上声调的低调伴随发声态—嘎裂声研究

上声的特质不仅仅表现在基频变化上，其“低”的发音会在发声上有所印记。孔江平（2001）指出，从发声类型的角度看，汉语普通话的上声在声调最低处常常出现气泡音。他认为这种发音特征在声音波形上主要表现为周期的不规则，并利用声门阻抗信号，提取出基频、开商和速度商等嗓音信号，同时通过与正常嗓音的对比，给出了气泡音的参数值。

Keating&Esposito（2006）通过对若干汉语普通话语料进行声学分析，提出汉语普通话四声中伴随低调（包括上声的低调部分和去声的末尾部分）往往会伴随嘎裂声特征的出现。而且在母语者的声调产生和感知上，除了基频的变化以外，发声类型的变化也起到重要的作用。关于发声类型对母语者声调的产生和感知上的作用，文章提出假设认为，除了那些非正常嗓音的作用以外，正常嗓音范围内的各种嗓音参数的变化也能够影响声调的产生和感知。

朱晓农、杨建芬（2010）指出，嘎裂声在北方话的低调中很常见，“基本上每个方言的低调中都能部分或零星地见到嘎裂声，就像北京话的上声”。“我们曾在多处提到北京话中常常可以听到嘎裂声，只是还没有达到每个人每次都要发的地步”。朱晓农、章婷、衣莉（2012）指出，上声的凹调不仅是一个音高现象，很多人在发北京话时也常常带嘎裂声。另外，北京话中“低凹、低平、低降、嘎凹”共时交替的情况很普遍，北京话上声和天津话阴平等都属于同一个声调类型“纯低调”，语音表现形式为低平、低降、低凹、低升、嘎裂低凹、嘎裂低降或者驰声低降等等，这些共性不在同一个语言中形成对立。

李晟熏、李爱军（2008）通过实验语音学的方法，对韩国人汉语声调中上声的偏误进行声学分析的听辨试验，结果发现，creaky voice是普通话上声感知的一个重要辅助发音特征，也可以作为声调习得的一个参考。

对于北京话上声，从基频模式上说，学界一致认为“低”是其主要特征，至于调型则有不同的意见。而从嗓音特点来说，是在发音时有嘎裂声的发声态出现，这是目前观察上声发声的一个新的视角。

1.4.2.2　上声调发声模式研究

关于汉语声调的嗓音发声表现，孔江平（2001）认为，从生理角度来看，音调的变化取决于声带振动的快慢，由此可见，声调研究应该属于嗓音发声的研究范畴。不同嗓音发声类型能够作为汉语声调的另一种超音段特征。研究中通过对比两对景颇语同声韵调音节，发现其基频没有本质的差异，差异来源于发声模式的不同。他将这种声带不同的振动方式定义为调质的不同。将调质分解成调时和调声两个部分。调时指的是肌肉对声带振动快慢的调节，调声指的是肌肉对声带振动方式的调节。前者对应于嗓音发声类型的时域特征，后者对应于嗓音发声类型的频率域特征。

关于北京话的发声模式，孔江平（2001）对持续元音（即用稳定的发声状态发一个持续一定时长的元音）的发声模式做了描述：持续元音的平滑音调的基频模式和开商呈正比关系，即基频越大开商越大；而基频模式和速度商则呈反比关系，即基频越大速度商越小。这个模型可以看成是嗓音的基本模式。而北京话的单音调声调模式表现为：基频和速度商之间是反比关系，当基频提高时，速度商的数值减小，基频降低，速度商数值增大；基频和开商间的关系比较复杂，第一调和第二调开商都是升，第三调开商先降后升，第四调的开商更为复杂，表现为升降升。这表明汉语声调的嗓音特征与持续元音的嗓音特征不同。

以往研究对嗓音在上声发声中的作用所谈不多，缺乏一定规模的案例调查和实验分析。另外，上声嗓音发声的参数会因人群的不同而表现出一定差异，所以研究中必须注意从不同言语社团中采集语料，并做社会分层的实验分析。这一方面以往研究做得较少。

1.4 以往的上声实验研究

1.4.1 基频模式研究

1.4.1.1 基于言语声学信号的基频模式研究

1.4.1.2 基于知觉的基频模式研究

1.4.2 发声研究

1.4.2.1 上声调的低调伴随发声态—嘎裂声研究