第四节 心理语言学的证据及其价值迁演
心理语言学的证据分布广泛,其价值在于吸纳这些证据的系统。例如在早期,来自自然界的信息手段的证据价值主要表现为语言进化的限制原则,但是随着认识的深化,鸟鸣声的价值不再仅仅是进化的限制原则,而是不同生存方式的主体的信息功能方式,因而成就了自然智能本体的一种形态。连接主义神经网络直接采用这些数据中的拓扑功能形态来论证并形成所需要的建筑。不过,无论在哪一个理论范式中,这些证据的价值认可合理与否影响着诸多相关领域结论的有效性。这些证据可以帮助我们面向语言关注的具体目的作出假设或者进行理论选择。关于证据价值迁演的主要认识是:各种实验发现均为实验条件构成的“场合”的认知功能凸显。随着智能层级不断由局域功能层级增加,有关结果出现的场合共现条件也会发生变化,因而其证据价值也需要重新分布。缺乏这方面的多种探索,便难以形成有效的预期理论。
一 自然界的相关现象
人类进化经历了由猿到人的过程。语言是如何进化而来,该问题可以从自然界由低级动物到高级灵长类动物的交际系统获得启示。语言是否为人类独有?语言中什么特征为动物界所共享?语言是否为某些单独体现于其他动物生存智能系统中的成分的共效产物?带着这些疑问,人们观察了昆虫、鸟类、狒狒等动物发息特征,作了猩猩语言实验,观察记录了非语言环境的儿童的语言学习表现,而且还对所谓语言基因作了实验分析,积累了不少富有价值但却亟待确切评估的证据。
(一)自然界的交际系统
蚂蚁、蜜蜂等昆虫均使用复杂程度不等的“交际系统”。其中,蜜蜂舞蹈所传递的信息不亚于人类使用语言作出描写的准确度:其舞蹈圆圈范围内中轴与太阳平行线的夹角代表了花粉源所在位置与太阳光线的平行线的夹角。中轴线的长度(即舞蹈距离)表示飞行距离,而舞蹈时摆动身躯的频率则表示花粉的质量。这些说明蜜蜂具有飞行数据和光源方向数据记录和提取的机制。观察蜜蜂则是记录这些舞蹈信息并以之驱动特定方向的飞行距离。但此种类似时钟上发条的机制信息方式并不具备“指”与“被指”之间关系的接受行为限制的“任意性(arbitrary)”符号意义。换言之,蜜蜂在进化中的高度功利化使其生存和信息手段均完全处于“机械”程序功能状态。
鹦鹉、燕雀等鸟类的声音信息系统可以区分出叫声和歌声。叫声只有一个“元音”或“双元音”,而歌声则可以是叫声的反复重复或者一串“元音”的组合变化。叫声用以警告有捕食者出现,协调一起飞行的动作,也可以表示入侵者的到来。鸟叫声通常是与功能用途相适宜的行为提示。歌声大多由雄鸟发出,主要用来宣示“疆域”和吸引雌鸟的注意。然而,并非某类歌鸟的所有雄鸟都能够“唱”得同等动听。欧洲苍头燕雀(chaffinch)的幼鸟需要在出生后10—15天内听父鸟的“歌声”才会发育出正常的“歌喉”(参见Harley,2004:63)。
哺乳类动物具有更为复杂的信息系统,其中尤以灵长类动物为突出。这类动物具有与人类更为接近的生理结构、较为复杂的社会组织和行为模式。其交际系统复杂程度似乎也与其生存状态的复杂度有关。一个广泛使用的例子就是狐猴。其常用的几种声音信息可以满足其生存状态中众多场合的需要,例如看到陌生事物时发出单一啧声,见面“寒暄”则发出哼声,驱赶带来威胁的弱势者则发出吠声,感到拥挤时则发出啪啪声。这些叫声不仅同伴狐猴理解,而且偶然遇到的“外地”狐猴也能够理解。较之上述其他一些动物,狐猴的交际系统具有近乎音义任意性的天然符号。
(二)动物语言训练
训练动物使用符号的实验构成了另外一类重要证据。这类发现进一步表明了使用语言的各种条件。接受训练的对象包括鹦鹉(Pepperberg,1981,1983,1987)、海豚(Herman,Richards&Wolz,1984)和猩猩(例如Kellogg&Kellogg,1933;Hayes,1951;Gardner&Gardner,1969,1975;Premack,1971,1976a,b,1985,1986;Terrace,Petitto,Sanders&Bever,1979)。
Pepperberg的训练对象是一只叫做Alex的非洲灰色鹦鹉(Psittacus erithacus)。训练方法是让Alex作为学生从旁观摩和参与竞争。13年后,Alex掌握了80多个单词(其中动词极少),可按颜色和材料等为40种物件归类,能够理解和产生一定长度的单词序列,可数到6。该发现表明存在离散范畴组合和初步的句法,也表明脑的容量乃至某些结构也许不是语言进化的关键特征。关键在于主体的感知系统适合抓取哪些声音特征用作音响形象的基础,其理解的认知范畴是否具有与主体深层次的关系缘由和对象关系缘由。
Kellogg和Kellogg(1933)把一只叫做Gua的雌猩猩与它们的孩子一起抚养,结果Gua不能产生像样的单词,也理解不了几个动词。Hayes(1951)等同样采用“养育”法来教一只叫做Viki的猩猩语言。6年后,Viki仅仅可以喉部沙哑而勉强地发出“mama”、“papa”、“up”和“cup”这4个词。Washoe则是一只从一岁起接受儿童式养育的雌猩猩,但是所教对象不再是人类口语,而是美国手势语(ASL)(Gardner&Gardner,1969,1975),到4岁时学会使用85个符号,而理解的词数目则更多,随后几年内其词汇量达到150—200个词(Fouts,Shapiro&O’Neil,1978)。它使用的句子中不仅有名词、动词、形容词、否定词、代词、引导疑问句的疑问词以及“胳肢”一义的施受关系,还可以用“花”转指“花的气味”,用“水”+“鸟”指不知其名的鸭子,用疑问词引导问句。此外,一只作为其“养子”的猩猩也似乎自发地从它那里习得了手势语。这些结果似乎表明猩猩的智力支持萌芽状态的词法和句法功能。同样接受手势语训练但非养育的猩猩Nim Chimsky则掌握了125个单词(Terrace,Petitto,Sanders and Bever,1979)。该研究对其语句记录结果显示,Nim的句子结构机械,一般都是跟吃、喝和玩这三种现场活动挂钩。一些长句也似乎只是短句的重复。这些事实似乎表明:人类虽然仅仅需要采集词的印记,但是词汇本身不是这些印记集合体。
成就更高的猩猩Sarah接受实验室方法的训练(Premack,1971,1976a,b,1985,1986)。实验者设计出形状、大小、质地各异的塑料块分别代表某个词或者概念。经过强化学习,Sarah可以读懂提示板上的意思并且完成提示的任务,比如看到意思为“放置苹果桶香蕉盘子”的提示,就会把苹果放到桶内,把香蕉放到盘子里。如果说此种“阅读”仅仅涉及简单的替换,Sarah自己摆弄塑料块表达意思时,不仅能够描写简单的物件和动作,还可以正确使用“如果……那么”、“……与……相同/不同”、“……是……的名称”。不同于以上普通的黑猩猩(Pan troglodytes),Kanzi则是选自社会生活丰富一些的矮个猩猩(Pan paniscus)。Kanzi并未接受食物强化训练。通过观察研究者对其母亲Matata使用几何图形代表单词的训练后,它便能参与到与人类在日常活动的交互过程,包括英语的使用过程(Greenfield&Savage-Rumbaugh,1990;Savage-Rumbaugh&Lewin,1994;Savage-Rumbaugh et al.,1986)。这似乎表明,Kanzi因为预期母亲的相似的神经结构而方便发现一些交际行为的“缘由”。Kanzi两岁半时掌握了7个符号,三岁时增加到50个,能够区分get、take 和put这些单词的意义,能够使用许多自发产生的“语句”。这些发现似乎表明,Kanzi的智力接近人类2岁儿童,但随后的语言习得在理解力和句法表现上都远远不能与人类儿童相比。
此外,以上所有实验均显示出一种共同的结果:较之名词,动词习得和理解难度较大,而所有受训动物都未能掌握功能词。这似乎表明,语言系统本身就是智能现象,而不单单是内外的关联。
以上证据具有多方面的价值。所有实验和观察结果都似乎统一表明了主体与环境的相互关系框架中存在着不同智能生物的智能类型,涉及语言与生存状态、社会、文化、心智等多方面的关系。这些远距离的“关系”可以帮助我们从认识上消除关于语言心理的一些不确定性。对此,既有语言认识中存在两种趋势:内在论认为人类语言与动物信息手段有着本质的差异,所以动物的相关表现缺乏相对于语言模型的证据价值。另外一些观点则认为所有现象都处于一个单一条件选择或多条件共效的进化框架中。此种争议可以揭示出新的思路和途径。
二 失语症症状及语言功能在脑神经系统中的实现方式
下面的两个失语症语样颇具揭示力。样本1的产生者的布洛卡区功能缺失,其中实义词均得以体现,含时间名词、地点名词、人物名词、数词和逻辑意义强的连词“and”,而句子形式意义强的词则无法产生,比如动词、冠词和介词。
样本1:Ah…Monday…ah Dad and Paul…and Dad…hospital.Two …ah…doctors…and ah…thirtyminutes…and yes…ah…hospital.And er Wednesday…nine o’clock.And er Thursday,ten o’clock…doctors.Two doctors…and ah…(摘自Goodglass&Geschwind,1976:408)
样本2:Well this is…mother is away here working her work out o’here to get her better,butwhen she’s looking,the two boys looking in the other part.One their small tile into her time here.She’sworking another time because she’s getting,too…(摘自Goodglass&Geschwind,1976:410)
样本2的产生者的威尔尼克区功能缺失。其形式表现则刚刚相反:形式意义越强的词越是自然到位,而布洛卡区损伤者可以产生的那些词在语义逻辑意义选择上则似无“理性”。负载信息内容的真实性律域与形式律域对照鲜明的失语症状似乎表明大脑对语言过程的支持具有严密的组织规律。有关发现尽管在成人失语症诊断方面发挥着重要的价值,但是对于语言本身的证据价值仍难确定,构成心理语言学中又一个颇具代表性的难题。
图1.1 失语症综合性经验模型(参见Lichtheim,1985;Dingwall,1993:49)
布洛卡(Broca)于1861年发现脑左侧前叶前偏后区域损伤会导致言语困难。他的判断是,大脑左半球主言谈功能,其损伤带来的言语症状为无法说话,尽管言语产生机制和理解力仍然完好。1874年,威尔尼克(Wernicke)进而发现左脑颞叶受损也会出现特定症状:言语流畅,形式完好,但却缺乏意义。这两个区域因其发现者而被分别称为布洛卡区和威尔尼克区,相应症状也被称为布罗卡失语症和威尔尼克失语症。威尔尼克于是提出了同时考虑这两个区域功能以及连接二者的神经束功能模型。给出了一个比较详尽的阐释,含听觉词形概念言语计划三个中心、向听觉词形中心输入的听觉通道和由言语计划输出的驱动通道。失语症共分中心损伤失语症以及通道和传导中断失语症。Geschwind(1972)则为威尔尼克模型进一步阐述了一个大脑语言处理流程:当我们听到一个词时,声音振动耳膜以后进入听觉信息加工区,然后被传递到威尔尼克区;如果我们再把听到的词说出来,那么信息则进而流向布洛卡区,该区激活面向言语输出的产生信息,并且把信息发送到各相关产生机制部位。
图1.2 大脑中语言处理功能机制及其分布(参见Dingwall,1993:61;修改自Liberman,2001)
该神经证据并不支持高度统一的大脑功能结构模型,但是大脑明显对于语言行为过程具有响应高层加工和支持低层加工的高度有序的系统。语言功能左侧化构成了一种比较突出的趋势。与语言的听说读写过程相关的区域主要分布于大脑左半球。布洛卡区位于左半球脑前叶下侧,与中央前回末端相邻,主语言理解和输出。威尔尼克区位于左半球脑顶叶下侧,与中央后回相邻,主要接收来自听觉区和视觉区的语言刺激。角回位于脑顶叶威尔尼克区后方的由视觉区传递信息的来路上,负责听觉和视觉信息的缓冲。弓状神经(纤维结构)束为布洛卡区和威尔尼克区之间的神经通道。中央前回接收布洛卡区的指令,激发和协调语音机制等。视觉区位于脑枕叶梢部,属于阅读过程的语言视觉形式信息处理区。主听觉区位于脑颞叶邻近中央沟末端处,负责处理语音信息。这样的大脑布局似乎支持面向言语产生的句法功能系统以及面向意义理解的语义系统和输入处理的句法回响系统。具体地说,具有系统功能的语法是更多地属于(或者更加关乎)语言产生的现象,而非直接的语言理解现象。用于处理真实信息的语义系统则是更多地属于(或者更加关乎)语言理解的现象。语言理解本身与语法的关系则首先涉及以不符合听觉习惯的注意为基础的语言知识以及以词语的意义的功能范畴为基础的语言知识。
失语症的诊断和治疗积累了大量的证据,并且发现相当一部分语言使用者并未出现左侧化语言功能定位,例如Goodglass(1993)采用从颈动脉注入麻醉剂的方法发现69%的失语症由左脑引起,然而还有13%的失语症则是由右脑引起。关于此种现象的理论解释存在两个版本:第一种是基于语言发展的成熟假设,认为婴儿出生时大脑两半球的相对于语言的功能是相同或者相似的,而左脑在发育成熟的过程中变得更加善于执行语言功能,因而出现了左侧区域功能专门化(Lenneberg,1967)。第二种解释为基于语言和大脑进化的功能不变式假设,即婴儿生来就具有了语言功能左侧化的发展规定性,只有左侧前后脑受到大面积损伤时右脑才会承担语言功能(Rasmussen&Milner,1975)。不过,即便年幼的儿童发生此种转移,右脑是否能够全面承担左脑的语言功能,这一问题仍然受到质疑(Dennis&Whitaker,1976,1977),需要有效综合多方面证据。
三 神经认知功能
1988年,Petersen及其同事采用正电子发射断层显像技术(PET)对语言的主要过程在大脑中进行了定位。得出的结论包括:听觉词在大脑左侧颞顶皮质获得加工;视觉词在左侧外纹皮质获得加工;语义联想在左脑前额叶腹侧皮质获得加工;词的生成牵涉前脑额叶背外侧皮质;一般反应性选择牵涉前扣带回(anterior cingulate);产生性编码和肌动编码牵涉左脑前运动皮质腹侧(left ventral promotor cortex)、左侧前脑岛以及补充运动皮质(supplementary motor cortex,SMA);肌体运动执行则牵涉邻近中央沟的中央前回的后部。这些发现引发了对于大脑处理语言的过程的功能部位的兴趣。
Price(2012)对他自己以及其他研究者采用功能性磁共振成像技术(fMRI)所得数据进行整合,给出了一个综述。听觉刺激先是激活听觉皮质(auditory cortex,A),然后在一个方向上向着颞上回(planum temporale,PT;superior temporal gyrus,STG)扩散,在另一个方向上向着前颞上回前部扩散(superior temporal gyrus-anterior,aSTG)。
视觉刺激激活脑枕叶皮质(Occipital,OCC)、脑枕叶下回(inferior occipital gyrus)和枕—颞区(Occipital-temporal,OT)。手与言语的一般动作选择功能出现于枕—颞区腹部中间部分(ventral occipital-temporal-middle part,mvOT)。视觉刺激的扩散区域为脑枕叶背侧(Occipital-dorsal,dOCC)和枕—颞区后腹侧(ventral occipital-temporal-posterior,pvOT)。此外,大脑亚皮质层双侧也呈对应地分布有视觉刺激激活扩散敏感区域。
图1.3 口语和书面语认知任务的激活扩散型功能分布(Price,2012)
语义和句法的各个处理层级均处于听觉区之下从颞叶极到威尔尼克区的处理带:a.词处理部位:词在颞叶上回脑间沟前部(superior temporal sulcus-anterior,aSTS)获得处理,亦即威尔尼克区(pSTS)内上方偏后的部位;b.语句和书面句子的处理:位于颞叶的听觉活动区域之下,除了在词处理区有激活之外,语义和句法正常的句子的最大激活区域为颞极部(temporal pole)和颞叶中回后部 (middle temporal gyrus-posterior,pMTG)。c.语义性的处理是主导过程,直接位于由听觉刺激激活的主听觉区及其双侧扩散区域之下的颞叶上回前部(superior temporal gyrus-anterior,aSTG)。语义处理的协同区域分布广泛:a)颞叶中回前部(middle temporal gyrus-anterior,aMTG);b)角回的腹部(ventral angular gyrus, AGv)、背部(angular gyrus-dorsal,AGd)和中间部位(angular gyrus-middle part,AGm)以及小脑右侧的后部侧叶(lobule VII,又作lateral posterior,VII);c)前脑回上缘(superior frontal gyrus,SFG);d)布洛卡区前部腹侧[又称额下回后部腹侧(pars opercularis-ventral,pOpv)]、额下回三角区(pars triangularis,pTri)以及额下回前部腹侧(pars orbitalis,又称ventral anterior inferior frontal cortex,pOrb)。这些区域主要参与语义上的判断和决策,对于音系判断决策功能的支持反而不是那么明显。
言语生成和再演的区域分布于小脑、布洛卡区和言语产生运动区多个联动区域。a.牵涉运动控制的部位:a)小脑(cerebellum)的中前部(lobule VI,CB—VI);b)主口腔动作的前运动区腹侧(ventral premotor area,vPM);c)中央前回主口腔舌头动作的部分[precentral(tongue),preC(t)]。b.词提取功能:a)位于布洛卡区前侧的脑前回中部(middle frontal gyrus,MFG)、脑前沟下侧(inferior frontal sulcus,IFS)和额下回三角区(pars triangularis,pTri);b)脑前回中部(middle frontal gyrus,MFG)和额下回后部背侧(pars opercularis—dorsal,pOpd);c.与词提取紧密相关的不出声的音系判断决策功能:a)缘上回腹侧(supramarginal gyrus—ventral,SMGv)这一邻近神经总束后端区域;b)中央前回主咽喉动作的部分[precentral(larynx),preC(l)];c)主产生动作控制的中央前回背侧(precentral-dorsal,preCd)。
上述功能区域具有共同的中枢型整合功能。利用熟悉的刺激所引发的感知和产生任务的激活区域对应于布洛卡区和威尔尼克区。这两个区域实现功能汇集,负责向其他部位发送和接收信号。
以上发现仍然主要是相关功能表现。大脑神经系统的处理功能有助于揭示人们在具体的语言发展和使用场合方便作什么以及能够作什么。面向语言的局域智能需要在方便实现的任务和能够实现的任务之间谋求合适的语言认知功能方式,包括分别适合发展和使用的限制、认知策略和认知努力。
四 神经元及其运算
据估计,人脑具有超过1012个神经元分布于大脑最近进化的皮质层以及各个信息接受和控制端。
大脑具有整体功能结构来执行各种动作和语言这样的宏观过程。这些过程得以实现均依赖神经元这一功能专门化的脑细胞的信息处理功能。神经元首尾互连,形成复杂而神秘的大脑回路。神经元由细胞体、细胞核、树突、轴突、带球状终端的神经末梢等组成,负责收集、运输和传递以电脉冲方式编码的信息。由细胞核和细胞膜组成的细胞体支持和维护神经元的生命过程。树突主采集和接收信息,具有多级髓磷脂层外鞘的轴突负责传输和加速电脉冲,神经末梢的末球则负责将信息传递给其他的神经元或者细胞。主要智力相关特征为其连接方式和信息传递过程的生化和电位表现。这些特征构成大脑智力的基本来源,对于学习、推理等心理现象具有直接的过程意义,因而也构成了智能模拟的主要对象。一个神经元的树突可以与别的神经元的末梢首尾连接,这样一个连接叫做神经结(synapse)。由于一个神经元可以具有许多树突和神经末梢,人们通过大脑发育和认知学习所不断产生的神经结就像是一个个逻辑开关形成了一个高级的神经网络,具有仿佛是遵守着某种至为高级的算法规则一样的严密的运作方式。当我们接收到一个可感觉的外部刺激时,神经元树突的接收器便感受到相应的脉冲“信号”。过去存在的一种理解方式是,神经结就像一个电子门路一样让特定的脉冲通过或者不通过。但其信息传递的功能实际上要比此种理解高级得多。
神经元组成的神经网络同时显现诸多特征。第一,神经元具有多种类型,例如感觉神经元的功能是把来自各种感官的信息传递到神经中枢;运动神经元或多级神经元具有起源于细胞体的多种过程;中间神经元则是形成神经网络的主体脑细胞。第二,神经元“点火”需要一定的膜电位,当膜电位未达一定要求时不能被激活,而且此种电位门槛要求随着激活的频率的增加和减少而有某种变化。第三,神经元具有不同的信息转送器,在功能上有兴奋型和抑制型之分。第四,在组织结构上,神经元构成的神经网络具有多个层级、一定的分布密度、可重复性质以及基础的(重复性)皮层回路。此外,大脑的具体部位具有确定的连接,感觉和运动神经元均具有传入和传出定位。第五,在时间控制方面,神经发生过程中细胞分裂数量方式受发育时间的影响,结点生长和衰退也有时间和空间上的限制,感觉神经系统的发展接受时间的制约(Elman,1999)。另外也有实验表明,具有与语言相关的FoxP2基因的老鼠的脑神经元轴突增长,树突增多。类似特征对理解语言涌现具有十分重要的价值。
存储和提取词的过程涉及神经元及其网络的功能。后面将会介绍的模拟研究采用人工神经网络,其建筑成分含输入神经元层、隐含神经元层和输出神经元层以及一个象征记忆的环境神经元层。输入神经元接受代表要区分的对象矢量化的数值,经过网络运算由输出神经元输出达到一定区分度要求的数值模式。这类模拟结果趋向于表明,该法不仅可以模拟各种主体条件和环境条件,给出区分词等功能机制,也可以预期语言形式发展和变化。这些证据对于语言和语言发展的各种认知功能形态具有重要的价值。
另外一种可能性则直接把语言过程的相关功能分布到神经系统的各个层面,包括由记忆序列定制到神经元的连接的具体功能方式。这类研究有可能最终表明语言与心智关系中的意识表现及其来源。相应发现可以具有多重意义:方便对于语言相关的各种功能形成新的更加符合人类应对环境变化需要的价值分布,而在理论上也方便我们更加合理地尊重目前用于定义我们自己的各类属性。