语音感知视角下的英语外国口音研究
上QQ阅读APP看书,第一时间看更新

2.4 口音感知与二语语音习得

在二语语音习得中,学习者既是说者又是听者,既要进行语音产出又要进行语音感知。图2.1中的言语链直观地表明了言语感知和言语产出密不可分。当学习者作为说者时,言语产出引起他们对自己语音的感知,通过对自己语音的感知判断,进一步调整接下来的语音产出。如此周而复始,说者的二语语音水平不断得到提高。可见,感知在这一过程中起到关键作用,只有学习者做到正确地感知,才有可能做到正确地产出。当学习者作为听者对交际对方的言语进行感知时,他会对听到的言语做出判断,这种判断也会对其本人的语音产出带来一定的影响。总之,语音感知在二语语音习得中起到非常重要的作用。在2.3小节,我们介绍了心理语言学中涉及言语感知的模型。这一小节将详细介绍与语音感知有关的二语习得理论、模型和分析方法。

2.4.1 错误分析

错误分析(error analysis)是用来研究二语学习者在语言习得中所犯错误的方法,分为五个步骤:样本收集、错误识别、错误描写、错误解释和错误评估(Corder,1973)。对口音的研究涉及错误分析的所有步骤,并有两个不同的研究视角——语音产出和语音感知。

语音产出研究与错误分析中的错误描写有关。这类研究以学习者/说者为中心,通过对比二语学习者和本族语者在语音上的差异,对学习者在语音习得中的错误进行描写,试图找出中介语语音的习得规律并加以解释。研究者或者总结学习者犯的语音错误(李小金,1994;隋慧丽,1997),或者通过语音分析软件和声学实验展示学习者的二语语音习得规律(陈桦,2005;石林、温宝莹,2012)。

语音感知研究则涵盖错误分析中的错误描写和错误评估。同语音产出一样,与错误描写有关的语音感知研究也是围绕学习者/说者展开,主要研究学习者/说者在二语语音习得中因为以母语的语音范畴去感知目标语的语音范畴,从而造成了语音错误(闫丽莉、蔡金亭,2004;马照谦,2007),也有部分学者研究感知训练对学习者提高二语语音水平的作用(Wang et al.,1999;程冰,2010)。与错误评估有关的语音感知研究从听者出发,侧重考察学习者/说者语音产出中的错误对听者的影响,这种影响可以通过“听者对说者言语的理解程度”或“听者对说者言语的情感态度”来衡量(Ellis,1994:63)。过往研究显示,言语的可理解度和听者的情感和态度变化均与说者的口音有一定关系(Brennan & Brennan,1981a、b; Anderson-Hsieh & Koehler,1988; Derwing & Munro,1997; Munro,2003),而口音与语音要素之间有着密不可分的关系。由此,笔者认为,除了Ellis(1994)介绍的两种衡量方式外,与错误评估有关的语音感知研究还有第三个探讨途径,即对口音感知与语音要素之间关系的研究,探究哪些语音要素更加影响听者对口音程度的感知和评判。

当然,语音产出和语音感知研究不是仅限于错误描写与评估,同时也需要对相关现象进行解释。根据不同的研究视角,语言学家们提出了不同的二语语音习得的理论模型,来解释语音现象并预测学习者的语音习得规律及习得中可能存在的问题。着重语音产出的理论主要有对比分析假说(Lado,1957)、标记区分假说(Eckman,1977)、系统发育模型(Major,2001)和优选论(Prince & Smolensky,2004);着重语音感知的理论主要有母语磁吸模型(Kuhl & Iverson,1995)、感知同化模型(Best,1995)、言语学习模型(Flege,1995)和感知语法(Boersma,1998)。

为了比较清晰地展示错误分析和语音习得研究的关系,我们以表格的形式进行了归纳(见表2.1),用3W1H(WHO, WHAT, HOW, WHY)来说明语音错误分析研究的对象、内容、方法和解释。

表2.1 二语语音习得研究与错误描写、评估和解释

2.4.2 语言迁移

语言迁移作为应用语言学、二语习得和语言教学的中心议题已长达至少一个世纪之久。近几十年来,它在二语学习中的地位被几度评定:“在20世纪50年代,它被认为是二语习得理论和二语教学中最重要的因素;在20世纪60年代,学习者的错误不再被看作语言迁移的证据而是‘创造性的建构过程’的结果,语言迁移的重要性也随之减弱,一些研究者甚至全盘否定语言迁移的存在而去寻找语言普遍性的解释;到了20世纪八九十年代,人们比较理性地看待迁移的作用,并开始关注迁移与其他因素之间的交互作用”(Odlin,1989:ix)。

语言迁移又叫语际影响(cross-linguistic influences),指“任何已习得或尚未完全习得的语言和目标语之间的异同点所产生的影响”(Odlin,1989:27)。按照是否有利于二语习得,可以分为正迁移和负迁移。迁移可发生在语言习得的各个方面,如语篇、语义、句法、语音和书写系统等,其中语音方面的语言负迁移最明显也最难以克服(王鲁男,2004)。Ioup(1984)指出即使在20世纪六七十年代,许多学者质疑对比分析的研究方法,认为在儿童和成人二语习得中,母语都不会起到干扰作用,但是他们却一致认为母语起作用的唯一方面就是在语音习得方面,这说明了语音迁移的显著性。Ioup也用实验表明说者口头话语中的语音特征可以帮助听者判断他们的母语背景,而书面语中的句法结构则没有帮助。当然,语音习得不仅受到母语的影响,还受到二语学习起始时间、学习者性格特征、受教育环境等因素的影响。但是Purcell & Suter(1980)在详细分析了几个影响因素后,发现与在美国的居住时间和英语语音的学习动机相比,母语是影响学习者的外国口音轻重程度的更大因素。

语言差异最突出的影响是学习者产出与目标语不同的语音模式错误,可以发生在语音的各个层面上。Odlin(1989)认为可以从音段音位和超音段音位两方面来进行分析。

2.4.2.1 音段音位方面的负迁移

Moulton(1962)在分析了英语和德语在语音系统上的差异后,运用对比分析法,总结出四种存在于音段音位方面的错误。虽然Moulton分类中“隐含的诸多与音系学理论和迁移有关的论断受到了挑战,但是他提出的分类仍不失为对二语语音音段音位错误的细致的分析”(Odlin,1989:115)。Moulton把音段音位错误分为四类:“音素错误(phonemic errors)、语音错误(phonetic errors)、音位变体错误(allophonic errors)和分布错误(distributional errors)”(Moulton,1962:101-102)。

1)音素错误

当两种语言的音素种类不一样时,就可能出现音素错误。例如,德语中有两个对立的清辅音:软腭擦音/x/和软腭塞音/k/,可以构成最小对立对/nɑxt/(Nacht“night”)和/nɑkt/(nackt“naked”)。但是英语中的音素只有/k/,没有/x/。因此,许多英语本族语者在发德语的/x/时会遇到困难,且常常把这两个音素组成的最小对立对混淆。类似情况也出现在中国、日本和韩国的英语学习者中。在日语、朝鲜语、中国的有些方言中没有齿龈近音/r/,所以一些操这些语言的说者对英语中/r/和/l/的区别不是很敏感,对含有这两个音素的最小对立对混淆不清,如/laIs/(lice)和/raIs/(rice)。

2)语音错误

在这里,语音错误是指当两种语言中都存在某个音素,但是这两个音素的物理属性(如声学属性和发音特点)有差别时,学习者可能会犯这类错误。例如,德语词rar和英语词rare是同源词,德语里的小舌音/ʀ/与英语中的接近音/r/对应,但是它们的音质差异很大,前者在发音位置上更加靠后。英语本族语者不习惯使用小舌发音,因此部分学习者发出的小舌音/ʀ/与德语本族语者的发音有很大不同。这一错误可能会导致言语可理解度的降低,更常见的情况是导致说话人的发音听起来带有很浓重的外国口音。

3)音位变体错误

音位变体是指“同一音位在不同环境中表现出的两个或多个语音上不同的音段”(特拉斯克,2000:12)。一种语言中某个音素的音位变体并不一定是另一种语言中的对应音素或其变体。二语学习者如果将母语中的音位变体直接硬搬到二语中,就会造成语音负迁移,从而出现音位变体错误。例如,英语和德语中都有齿龈塞音的清辅音/t/。在美式英语中,当/t/处在元音之间时,清辅音/t/听起来很像浊辅音/d/,所以writer和letter听着很像rider和leder。而德语中的清辅音/t/处在元音之间时基本上还是发成清辅音,比如bitter(“bitter”)。不清楚这一差异的美国德语学习者可能会将德语中的bitter读成bidder。

4)分布错误

如果两种语言中某一相同或相似的音素在语言中的分布不一致,这也可能会造成语音负迁移。例如,德语中的音素/ts/听起来很像英语中塞擦音/ts/的发音。英语中的/ts/可以出现在词中或词尾,如Pittsburgh和its,因而英语本族语者在发以/ts/结尾的德语词时不会遇到困难,如Sitz(/zIts/“to seat”)。与英语/ts/不同的是,德语/ts/还可以出现在词首,如zu(/tsuː/“to”),母语为英语的德语学习者可能会发成/zuː/。在其他情况下,这种错误可能会混淆两个完全不同的词,如zeugen(/tsɒIgən/“to testify, to witness”)和säugen(/zɒϕgən/“to lactate, to suckle”)。

2.4.2.2 超音段音位方面的负迁移

音段层面的语音迁移非常普遍,超音段音位层面的负迁移也很明显。语言间超音段层面的对立主要表现在重音、声调、节奏和其他因素上。

1)重音模式

重音模式可以影响音节和构成音节的音素的发音。例如,英语中的一些单词既可以用作名词,又可以用作动词。词性的改变可能会带来重音上的变化,如combine作名词时读作COMbine,而作动词时读作comBINE。重音的改变影响到了单词第一个音节内元音音素的发音,o在COMbine中读作/ɒ/,而在comBINE中读作/ə/。语言的重音模式不仅会影响言语产出,而且还会影响听者对言语的听辨。如果二语学习者的重音模式不合乎二语规范,音素的发音也可能会偏离目标语,这会导致听者不理解或误解学习者的言语。Bansal(1976,转引自Odlin,1989)表明重音错误是导致印度英语学习者的言语不能被理解的最重要的原因。例如,diVIsions有时被读作DIvisions,经常被英国听者误听为REgions, talking among themSELVES有时被读成talking among THEMselves,经常被听成talking among DAMsels。

二语学习者的重音模式也可以体现出母语的负迁移。Andrews(1984,转引自Odlin,1989)在研究二语习得中英语学习者的重音习得规律时发现以法语为母语的学习者倾向于重读单词的最后一个音节或靠近词尾的音节,这与法语单词的重读规则一致。其他学者的研究也证明了母语负迁移在重音习得中的影响。高琳、邓耀臣(2009:16)借助英语口语语料库进行了大规模的调查,统计结果发现单词重音位移现象在中国非英语专业大学生中普遍存在,多音节词的重音位移最为常见。作者认为重音位移现象产生的一个重要原因就是“汉语和英语在语音体系和词重音模式方面存在很大差异”。高歌、秦洪武(2012)利用语音实验研究证实了中国英语学习者的重音模式受到汉语词汇发音“后重”的母语经验的影响,如将HOSpital发成hosPITAL是受到了汉语对应词“医院”(yīyuàn)的重音和声调的影响。再如把INTEResting发成interESTing,也是受到了汉语对应词“有趣”(yǒuqù)的声调的影响。在“医院”和“有趣”两个词中,它们的第二个音节都读去声,即全降调,在听感上比前一个音节“重”,部分学习者在读对应的英语单词时也相应地重读了第二个音节。由此可见,如果英语学习者没有很好地掌握英语词重音分布规律的话,他们就会倾向于“借用”母语对应词的重音模式,从而发生语音负迁移,造成明显的外国口音。

语音迁移不仅可以影响词重音的习得,而且还会影响句重音的习得。在考察尼日利亚英语的言语可理解度时,Tiffen(1974)发现句重音是影响英国人理解尼日利亚英语的最主要因素。他还发现与母语是约鲁巴语(Yoruba)的说者相比,母语是豪萨语(Hausa)的说者的言语比较容易理解。这主要是因为豪萨语的重音模式与英语的重音模式更加相似。

2)节奏

语言间的语音差异还表现在节奏上。就英语和汉语而言,英语中的重音是节奏的标记和灵魂,没有重音就没有英语节奏。而汉语的节奏主要体现在声调的变化上,承载声调的平台是音节。英语元音遵循“强的更强,弱的更弱”的配置原则,汉语元音配置的总体趋向则是“中庸之道”“不偏不倚”,绝大多数音节配置的是饱满元音(许曦明,2008:前言i)。英汉两种语言的节奏差异造成了英语本族语者对重音非常敏感,而对声调不敏感,汉语本族语者对声调非常敏感,而重音意识贫乏。这就可以解释为什么欧美留学生说汉语时带洋腔洋调,而汉语学生说英语时带汉腔汉调了。

3)声调

声调语言运用声调在单词层面来区分意义,而语调语言则使用声调在词组和句子层面来区分意义。在声调语言中,音高可以区别意义。例如,汉语普通话中的四声(阴平[55]、阳平[35]、上声[214]和去声[51])。同样一个音节mɑ,加上不同的音高,就会产生四个不同的意思:mā(妈)、má(麻)、mǎ(马)、mà(骂)。这种音高的使用方法与大多数欧洲语言不同。所以,对声调语言的习得在很大程度上依赖于学习者的母语与目标语在语言类型归属上的相似度。Gandour & Harshman(1978)的研究结果表明听者的母语背景可以帮助他们对相似语言的声调进行感知。在研究中,他们对比了母语为泰语、约鲁巴语和英语的听者对声调的感知,发现约鲁巴人比美国人更容易掌握泰语的声调,这是因为约鲁巴语和泰语同为声调语言,而英语则是语调语言。Gandour和Harshman的研究也说明母语和目标语的差异程度会导致成功习得目标语所花费的时间不同。这可以从美国国务院驻外机关事务局(Foreign Service Institute)在1985年颁发的培训外交使团人员的语言培训计划中看出(Odlin,1989)。该计划的培训目的是帮助学生获得较高的二语能力。在接受培训前,学员间的语言学习能力没有显著性差异,且他们每个星期的学习时间均为30个小时,培训结束后需要达到的语言能力要求相同,但是语言学习花费的最短时间却不同,从20周到44周不等。例如,学习德语、法语、意大利语和西班牙语至少需要20周,学习丹麦语、挪威语、荷兰语至少需要24周,学习印度尼西亚语和马来语至少需要32周,学习汉语、日语、印度语却至少需要44周。很明显,最直接的解释就是对于英语本族语者来说,这些语言有不同的习得难度。进一步分析后可以发现,较易学的语言与英语有很多相似点,基本上都属于日耳曼语族或罗曼语族,较难学的语言种类很多,但是一般来说,它们和英语的结构差异较大。当然,这并不是说母语和目标语的相似点多就意味着目标语容易学。有研究表明,虽同为声调语言,因受到自身母语声调系统的干扰,母语为粤语的学习者在习得汉语普通话时也会遇到困难(刘艺,2008)。

4)语调

在语调语言中,音高指的是语调。它虽然不能区别音素的意义,但是却有其他一些功能。语调可以用来标示句法结构的边界,能够指示话题的开始和结束,和提示话轮的转接等。各语言在语调的功能上具有一些共性,例如,几乎所有语言都使用降调来表示语法单位的完结;如果说者仍有话要说,通常使用上升的语调(赖福吉,2011)。尽管如此,二语学习者的语调习得在一定程度上会受到母语的影响。例如,在调群切分上,中国英语学习者主要采取停顿的方式,较少依靠音高重设,具有明显的中介语特点,母语迁移作用较显著(陈桦,2008);在话题转换方面,较少使用不同话题转接的韵律参数,如音高峰值和音域值的调整、停顿时间的变化、末尾音节的延长度等(夏志华,2013)。

除了表达语言信息外,语调还能够传递说者的态度、情感等非语言信息。这类信息的传达可能带有语言普遍性,因为“很多不同语言的发音人在传达相似情感信息时会有相似的音高变化”(赖福吉,2011:242)。例如,虽然有时我们听不清人们在说什么,但是从他们言语的语调中我们能猜测出他们的情绪。尽管如此,学习者学习二语语调的情感功能时经常会遇到困难。Rintell(1984)的研究表明二语学习者对目标语的情感语调的感知受到母语迁移的影响。她发现与西班牙语本族语者和阿拉伯语本族语者相比,汉语本族语者对英语情感语调的判断与英语本族语者的判断相比存在较大偏差。Abelin & Allwood(2000)在对瑞典语的情感语调进行跨语言感知的对比研究中也发现受试对情感语调的感知与其母语背景有关。他们对比了母语分别为瑞典语、英语、芬兰语和西班牙语的听者对一名瑞典语本族语者使用瑞典语表达不同情感语调的判断,发现母语是瑞典语的听者在判断中的成功率最高。

综上所述,语音迁移可以发生在语音的各个方面。语音的负迁移可造成学习者的言语可理解度降低,也可以使学习者的二语语音带上不同程度的口音。因此,语音负迁移不容忽视。通过以上的研究介绍也可以看出,语言迁移理论不仅可以解释二语学习者在中介语语音产出上的特点,同时还可以解释听者在言语感知上的差异。

2.4.3 语音范畴感知模型

语言迁移理论可以解释学习者二语语音习得过程中的错误来源,但是却只局限于语音系统对比本身,也没有解释为什么会发生语音迁移。20世纪80年代以后,迁移研究出现了转向,迁移开始作为二语习得过程中的一个被解释对象来考察。此外,随着20世纪70年代范畴感知研究在幼儿语音习得过程中的广泛开展,二语习得研究者们认为范畴感知研究也可以用来解释成人语音习得,由此开始以学习者自身为中心,将学习者的语言经验纳入解释语音习得的范围,同时为迁移现象的解释提供了一个视角。下面是几种常见的范畴感知模型。

2.4.3.1 母语磁吸模型

人类感知系统将外界刺激归为不同的范畴,许多范畴都具有内部组织结构。一个范畴中的所有成员在感知上的地位并不平等,其中一些成员较其他成员有典型地位。但是范畴典型性(category goodness)是相对的,一些成员只是比其他成员更具有代表性,是更好的范例而已(Rosch,1975)。Kuhl(1991)认为人类的语音范畴内部也有其内在结构,对成人和6个月大的婴儿的实验证实了她的观点,并表明语音范畴内部也有原型。原型就像一块“感知磁石”(perceptual magnet),用来吸附与自己相似的语音。这种吸附作用(cohesiveness)使原型与其周围语音变体的感知距离缩短。反之,如果某些语音与原型差异较大,它们之间的感知距离就会被拉大,也就不能被原型所吸附(Kuhl,1991)。后来,Kuhl在1993年提出了母语磁吸模型(Native Language Magnet Model)(Kuhl,1993)。

母语磁吸模型原本是利用感知磁石效应来解释婴儿在第一年中语音听辨的变化的。婴儿在没有相关语言经验的前提下就可以辨别不同自然语言的语音,但是随着某一种语言经验的增加,语音处理的感知机制发生改变,婴儿只能感知与他们的母语有关的语音特征。研究发现,婴儿从10个月至12个月开始,对语音范畴的感知从普遍语言辨音向特定语言辨音转变(Werker & Tees,1984)。具体来说,对元音感知的转变要早于辅音,从6个月开始,婴儿辨别非母语元音的能力出现下降趋势(Polka & Werker, 1994),10至12个月开始,他们辨别非母语辅音的能力开始下降(Werker & Tees, 1983、1984)。

Kuhl(1993)、Iverson & Kuhl(1995)表明母语磁吸模型也可以用于二语语音习得研究,能够解释二语学习者在非本族语语音听辨中的感知难度。在二语语音习得中,学习者的母语感知经验可以造成学习者在二语语音感知中的困难。原先的语言经验改变了语音感知模式,造成了感知空间的扭曲或错位(distortion)。所以,学习者的语音感知机制服务于母语语音单位的声学统计的总结,并在大脑相关系统中固定,这降低了学习者对母语语音原型周围音位变体的敏感度。因此,母语磁吸模型预测,语音相似度决定二语语音的听辨难度。当二语语音与母语语音原型非常相似或接近时,学习者会难以把两者区分开。母语磁吸模型的这一观点与迁移理论的观点正好相反,后者认为母语和目标语越接近,学习者就越容易习得目标语语音。

2.4.3.2 感知同化模型

感知同化模型(Perceptual Assimilation Model)是Best(1995)提出的感知模型,广泛应用于二语语音感知研究。它与母语磁吸模型的理念一致,但不是基于感知距离,而是以音姿(articulatory gesture)为基础。

感知同化模型的基本前提是非本族语的音段是听者根据它们与自己母语语音空间中音段的异同点来感知的。普遍的语音域和母语语音空间由声道的空间布局和音姿的动态特点决定,语音的这些属性提供了母语和非母语语音音位相比较的维度。例如,如果一种语言中有双唇塞音、齿龈塞音和软腭塞音,而没有齿间塞音,那么发齿间塞音时的舌尖持阻位置应该与齿龈塞音更加接近,因为这两种音的发音方式相同,且持阻位置较双唇塞音和软腭塞音更接近(Best,1995)。

Best认为,非本族语音位和本族语语音态势的相似点可以表现为持阻点和主动发音器官主动发音器官的英文名称是active articulators,指能够独立活动的发音器官,如舌尖、下唇等。与被动发音器官(passive articulators)相对,如齿、齿龈、硬腭等不能独立活动的器官。在空间上比较接近,以及持阻程度和音姿阶段都比较相似。这些都可以用来确定听者对非本族语语音的感知同化程度。也就是说,听者能够辨别非母语语音的音姿是否与母语音位的音姿相似。同时,听者也会注意到非母语语音音姿特点与母语音位特点的不一致,特别是当两者差距比较大时。在差距非常大时,听者可能认为听到的语音整体上具有人类语言语音的特点但是与母语中的任何一个语音范畴都不相似。在极端情况下,听者甚至不能辨认听到的声音是否属于人类语言的语音,因而认为是一种非语言的声音,比如声道发出的其他声响(如哽咽声),人类发出的声音(如打响指),或非人类发出的声响(如木塞“砰”地一声)。

同化(assimilation)是对非本族语音位的确认/标签、分类或范畴归属(包括范畴典型性评估)的判定。具体来说,从感知同化的角度看,与本族语/母语语音系统相比较,非本族语音位可分为以下三类(Best,1995:194-195):

(1)与母语中某一范畴的语音相同或相似。非本族语音与本族语中某一个特定的音位或辅音群(或串)范畴相似,可被感知为这一范畴中的原型、一个可被接受但并不理想的音位,或一个明显“边缘”的音位。

(2)与母语语音相似,但不能被归入母语语音体系中的任何一个范畴。这种非本族语语音确实与本族语语音空间的范畴相似,但是却不能被任何一个母语语音范畴同化,游离于母语各音位范畴之间。

(3)与本族语语音范畴完全不相似。这类音不能划归到本族语语音空间内,对学习者来说,听起来像非语言音(nonspeech sound)。

两个处于对比关系对比关系的英文名称为contrast,指两个或多个出现在同一个环境并能区别意义的音段之间的聚合关系。处于对比关系的音段必须视为不同的音位(特拉斯克,2000:67)。例如,英语中的pat /pæt/和bat/bæt/的意义不同,/p/和/b/是对立关系,属于不同的音位。的非本族语音位的同化模式取决于其中每个音位的同化程度。处于对比关系的音位的同化模式可总结为六种(Best,1995:195):

(1)TC型(Two-Category Assimilation,简称TC Type)。每个非本族语音位分别被感知为不同的母语语音范畴,且能够清楚地区分这两个非本族语音位;

(2)CG型(Category-Goodness Difference,简称CG Type)。两个非本族语音位都被感知为同一个母语语音范畴,但是它们与母语语音原型的感知距离不同。比如,一个可能是可接受的音位,另一个可能是比较边缘(deviant)的音位。也就是说,对这两个音位的感知难易程度取决于它们与典型范畴的相似程度。但是,对CG型来说,区分的准确度属于中等偏上的级别;

(3)SC型(Single-Category Assimilation,简称SC Type)。两个非本族语音位都被感知为同一个本族语语音范畴,且与原型的感知距离相等,即两个音位同时处于被接受或被边缘化的地位。这时,学习者对两个音位的区分度较低;

(4)UU型(Both Uncategorizable,简称UU Type)。两个非本族语语音都落在语音空间里,但是却没有被感知为任何的本族语语音范畴。根据它们之间的相似性和它们与本族语语音范畴的接近度,它们被感知为非本族语语音的可能性不同,从很小到很大不等;

(5)UC型(Uncategorized versus Categorized,简称UC Type)。一个非本族语语音被感知为一个母语语音范畴,另一个落入语音空间但在任何本族语语音范畴之外。这时,学习者能够非常好地区分开这两个非本族语音位;

(6)NA型(Nonassimilable,简称NA Type)。两个非本族语语音落在言语域之外,不能被学习者感知为语言音。当然,它们被感知为非语言音的地位也会随着与母语语音范畴感知距离的远近而变化。学习者能够较好或非常好地区分这两个非本族语音位。

Best & Tyler(2007)将感知同化模型的研究范围拓宽到二语语音感知领域,对比了单语制和双语制在语音感知中的作用,指出单语学习者和双语学习者拥有的语言经验能够影响他们对二语的语音感知。同时,他们将研究提升到音系学层面,从音系学和语音学两个层面界定了一语和二语的相似性。

2.4.3.3 言语学习模型

言语学习模型(speech learning model)由James Flege提出,指出了语音感知在二语语音学习中的重要地位,并认为二语语音发音错误大多源于感知偏误。Flege与其合作者从20世纪80年代开始进行了大量的实证研究并于1995年提出了言语学习模型(Flege,1995)。这一模型不仅关注一语和二语的双向互动,而且还关注感知和产出的关系。本书要探讨的是听者对外国口音的感知,因此,笔者在此重点介绍一语对二语语音感知的影响。

与Lado的对比分析不同,Flege认为第一语言中存在的相似音素是二语语音习得中的难点。言语学习模型和感知同化模型也有差异:感知同化模型主要解释二语学习者在语音学习的起始阶段对非母语语音的感知困难;言语学习模型关注的是二语语音习得的最终状态(ultimate attainment)和二语语音感知和产出的发展性变化,比较适合解释二语语音习得的后期阶段。可以说,两种模型在解释二语语音习得上可互为补充。

言语学习模型认为帮助个体习得一语语音系统的语音学习能力是终身的,任何时候都可及。学习者参照母语的语音系统来习得二语语音,把听到的二语语音分为“等同语音(identical)、相似语音(similar)和新语音(new)三种”(Flege,1987b:48)。等同语音是指在本族语语音系统中有一个和二语音素完全相同的语音;相似语音指的是与一语音位的声学实现方式不同、在一语中没有一个很容易识别的音位;新语音是指在一语语音系统中找不到对应成分的语音。在这三种类型中,等同的语音很容易被二语学习者感知。如果是相似的语音,学习者会用一语语音中的音位代替这个二语音位。如果是新语音,学习者会为这个音位设立一个新的语音范畴。也就是说,当学习者遇到新语音时,随着他们二语语音经验的增长,他们能够觉察一语和二语语音的区别,并最终有可能建立新的二语语音范畴。

可以看出,二语语音学习的困难取决于二语语音与一语语音的感知距离。二语语音与它最接近的一语语音的感知距离越大,两个音位之间的语音差异就会越容易区分开来。如果二语语音和与之对应的一语语音太相似的话,学习者就不能够感知两者的差异,也就不可能形成新的二语语音范畴。在这种情况下,一语语音范畴会被再利用,一语和二语语音范畴会同化,产生一个融合一语和二语特征的新语音。那么,随着学习者二语语音经验的增加,他们对这类语音的习得将会“接近,而不会达到二语语音规范”(Flege,1987b:50)。

此外,Flege还非常强调学习者的二语语音输入的重要性(Flege,2009)。言语学习模型指出,与一语语音习得一样,二语语音输入在一定程度上也会影响学习者对二语语音的习得。从以上的讨论中可以看出,语言经验在二语语音的成功感知和语音范畴的形成上有着重要作用。如果学习者接受的是带有口音的二语语音输入,语言经验可能会起反作用。

2.4.4 感知语法

感知语法(perception grammar)是功能主义音系学语法模式中的重要组成部分。针对音系学理论中日益抽象的形式化趋势和优选论在制约性条件优选论认为语言实际上是由两种相互冲突的力量交互作用的结果。一种力量源于省力原则,这是由人类惰性所致,即人类在能量上力求以最低限度的付出换取最大限度的回报;另一种源于辨义原则,这是由信息总量要求所致,即人类要求尽可能清楚地把要表达的信息传达出去。这两种相互冲突的力量在优选论中体现为两类相互冲突的制约条件:触发变化以使语言形式易于表达的标记性(markedness)制约条件和阻止变化以使语言形式具有更多的区别性的忠实性(faithfulness)制约条件。(马秋武,2008:38-39)中功能性体现不足的情况,Paul Boersma在优选论的基础上提出了较为彻底的功能音系学(functional phonology)(Boersma,1998)。其功能性体现在“制约条件的制定、排序和评价完全是功能性的,而且这些制约条件,甚至其排序,在某种程度上反映了语法之外的因素,比如发音生理机制和听觉感知”(马照谦,2007:81)。

从以上几种语音范畴感知模型可以看出,语音的产出和感知密不可分。但是Boersma原则上区分了产出和感知,分别对应言语产出语法(production grammar)和言语感知语法。当然,两种语法通过底层的感知表达式(underlying form)联系起来。产出语法和感知语法共同构成了功能音系学的语法模式。具体可见图2.3。

图2.3 功能音系学中的言语产出与感知图解(引自Boersma,1998:143)

图2.3展示了一位说者和一位听者在进行言语交际时使用的言语产出和感知系统,图中也标示了功能音系学的语法模式中涉及的相关系统和过程。

在图中,我们可以看到下列表征式:

(1)声学输入(acoustic input):由说者发出并传送到听者耳中的语音。因为这是独立于语言的表征式,在图中用“[ ]”表示;

(2)感知输入(perceptual input):由说者发出并被听者感知的语音,以语音感知特征(如周期性、噪音、频谱等)及其结合形式表现出来。在图中用“/ /”表示;

(3)感知特征赋值(perceptual specification):用感知特征表示,作为底层形式(underlying form)存储于语言使用者的词库中。在图中用“||”表示;

(4)发音输出(articulatory output):说者发出的语音,以音姿(发音器官的位置、肌肉的紧张程度等)及其结合形式表现出来。在图中用“[ ]”表示;

(5)声学输出(acoustic output):说者发出的语音,是说者发音输出中无意识的产物,在图中用“[ ]”表示;

(6)感知输出(perceptual output):说者感知到的自己的声学输出,在图中用“//”表示。

图中也显示了以下的言语处理系统:

(1)言语产出系统(production system):说者的言语产出系统也称为产出语法,将话语的底层感知特征赋值转化为表层形式;

(2)言语感知范畴系统(perceptual categorization system):也叫感知语法。听者利用感知语法将听到的声音输入转换为感知表达式。他们利用这一系统来感知说者的声学输入和自己的声学输出;

(3)言语识别系统(recognition system):又叫识别语法。帮助听者将感知输入转化为底层形式;

(4)对比模块(comparison module):对比模块有利于语言习得。如果学习者感知到自己的语音输出与其他说者的语音输出不一致,学习者就会调整自己的语音输出,这样就迈出了学习的一步。

图中的缩写形式ART和FAITH指的是发音制约条件和忠实性制约条件。

产出语法和感知语法共同组成了功能音系学的语法模式。鉴于本书考察的对象是听者对语音的感知,笔者在此介绍一下感知语法部分关于功能音系学的完整介绍,感兴趣的读者可参见Boersma(1998)。

一个典型的听者语音感知的范畴化过程可用表2.2中的候选项竞选表来表示。在这个竞选表中,[ac]表示一个声学输入,/cat/表示感知范畴候选项。由于/cat2/违背了等级较高的制约条件A,而/cat1/违背的是等级较低的制约条件B,所以,/cat2/被淘汰、/cat1/胜出。“在语言交际过程中,听者接收到的是说者发出的声学信息,而感知语法的作用就是通过制约条件(如表2.2中的A和B)间的相互作用将听觉输入项(即声学参数)解析为有限数目的离散范畴,并投射到底层的感知表达式(即音位)上”(马照谦,2007:82)

表2.2 听者语音感知范畴化过程的候选项竞选表(引自Boersma,1998:147)

感知语法体现了两个功能性原则:①语音辨认的最大化(maximization of recognition),指听者试图最大限度地利用听到的声学信息来重构言语的意义;②范畴组建的最小化(minimization of categorization),指不同说者、甚至是同一说者自身产出的语音信息有很大的差异,把如此多的语音感知信息归为可被分析的语音范畴有助于言语排歧,例如,“对听者的语音感知来说,把一个语音感知连续统划归为两个范畴要比划归为五个范畴更有利”(Boersma,1998:2)。

在这两个功能性原则的指导下,感知语法有以下忠实性条件和制约性条件:

忠实性制约条件有两个:PERCEIVE和∗WARP。

Def. PERCEIVE(f)≡ ∃xifac⇒∃yifperc

“A value x on a tier f in the acoustic input is recognized as any corresponding value y on the same tier”(Boersma,1998:163).

“在声学输入的音层f上的x值可以被辨认为同一音层上任一个相匹配的y值”,即任何一个声学特征值都可以被识别为一个相应的感知特征值。如果不能被识别,就违反了这条制约条件。

Def. ∗WARP(f: d)≡ ∃xifac∧∃yifperc⇒︱xi-yi|<d

“The perceived value y of a feature f is not different from the acoustic value x of that feature by any positive amount of distortion d”(Boersma,1998:164).

“声学特征fy值和同一特征的x值是否存在差异取决于这两个音值相减之后绝对值的大小”。也就是说,“一个声学特征值不能被识别为一个差距较大的声学特征值”(马照谦,2007:82),绝对值小的要优于绝对值大的,绝对值小,亦即扭曲度(distortion)小。因此,这个制约条件有个普遍的内部排序,即扭曲度最小原则(Minimalization of distortion),可被形式化表示为:

∗WARP(feature: d1)>>∗WARP(feature: d2)⇔d1>d2

例如,第一共振峰(F1)为600Hz的元音最有可能被感知为一个低中元音,而不太可能被感知为一个高元音第一共振峰(F1)的频率与元音高度成反比(赖福吉,2011:184)。元音的F1频率范围在200Hz和800Hz之间。元音越高,F1越接近200Hz;元音越低,F1越接近800Hz。

感知语法中有一个标记性制约条件∗CATEG:

Def. ∗CATEG(f: v)≡ ∃xifpercxiv

“The value v is not a category of feature f, i.e., a perceptual feature f cannot be recognized as the value v”(Boersma,1998:164).

v值不属于感知特征范畴f,即感知特征f不能被辨认为v值”。

语音感知过程是声学输入的范畴化过程,利用忠实性和标记性制约条件及其排序对听者接收到的声学信息进行分析,并将最优的候选项投射到底层的感知表达式。Boersma(1998)用大量实例论证了感知语法的适用性。国内学者马照谦(2007、2010)运用功能音系学理论对中国英语学习者的音段层面的语音习得错误做了优选论分析。

2.4.3和2.4.4小节介绍了几个二语语音习得领域具有较大代表性且与言语感知有关的理论模型。母语磁吸模型、感知同化模型和言语学习模型是从认知心理学的角度提出的,学者们在模型提出前后进行了大量的实证研究;作为功能音系学语法模式组成部分的感知语法,主要以优选论为基础,虽然比较抽象,但是不失为解释二语语音感知的好理论。它们都没有局限于单纯地把两种语言的语音系统做对比,而是更加关注学习者的语言经验对二语语音习得的影响,拓展了言语感知研究方法的范围。值得注意的是,以上这些模型和理论主要从学习者/说者的视角展开,研究学习者如何通过感知二语语音来提高自己的二语语音产出。实际上,它们也可以作为理论模型来解释听者对说者言语的感知,即研究听者是如何感知说话人的语音的。此外,它们只考察了学习者对音段音位的习得,没有涉及超音段音位。我们知道,超音段音位的习得同样受到学习者语言经验的影响。所以,本书尝试拓宽言语感知理论和模型的应用范围:运用这些模型和理论来考察听者的语音感知,同时尝试运用感知模型解释超音段音位的感知和习得。