第五节 心理语言学的研究
心理语言学的研究当然不能缺少领域训练、文献工作以及提出问题和假设的理论(含解释)基础与对象尝试性关联的过程。在该研究者认知准备的前提下,心理语言学的研究的实现主要是采集和处理数据的过程。有关方法和技术可以反过来影响心理语言学发现问题、分析问题和解决问题的“路数”。研究的一个就近目的就是揭示语言事实相互关联的最佳语言认知功能模型。这也是为人类认识活动建立以自然语言智能自足的“理论框架”的一个基本前提。这就要求我们逐步破解语言的心理相对性表现,走向更加客观的智能本质。
一 心理语言学研究的目的
前文对语言相关的各层事实和证据做了分析陈述,可以使我们明白一个统辖全局的研究目的。
语言关注不再是简单地面向语言理解提供所需知识,也不再仅仅是如数家珍地描写各类语言事实,而是要求一种工程型方法来寻找自然智能可以提供和实际提供的语言认知任务的问题求解。显然,此种“问题求解”对于研究者无疑需要参照一定的目标功能。参照这个框架,有助于我们进一步区分“方便”作到的语言处理和“能够”作到的语言理解的认知特征。这个参照框架允许我们在超越语言现实时仍然可以获得可以信赖的依据。换言之,各个方面和各个层级的语言事实都会一再加入对象事实范围,但是每一次加入的证据价值也会发生相应的变化。这个理解的重要性不言而喻,因为这也是我们走向解决极具挑战性的各类问题的广阔的可能语言认知空间的第一步。
这一研究目的也会带来相应的研究特点。前文表明,在最具限制意义的神经认知功能现象之下隐含着多种可以模型化的功能方式和关联。这意味着,语言不仅“走”具有直接的解剖学连接的“路数”,还有适应面向语言的认知功能的效应性“连接”一面。这个区分乃至更多的区分在面向语言发展的情况下尤其显得必要。这也从理论上表明,语言过程的神经认知实现方式虽然属于神经科学的直接对象,但在语言研究不断深入的情况下,有关发现或者“事实”则仅仅意味着价值不断变化的证据。在一个语言神经机制网络的条件下,还有一个场合相关的语言认知功能“神经网络”,二者之间通过功能化达成协作乃至通过语言进化来实现功能的统一。
这一研究目的也要求一种理解:我们需要恰当看待既有研究,明确领域中既有研究的级次。早期语言关注在于实现语言事实的描写。早期的心理语言学研究则在于探明听、说、读和写等语言方式下的认知过程。在这一基础上的进一步探索目的在于确定描写语言过程的认知参数,继而利用这些参数对语言发展中的认知功能方式给出描述。各个级次研究的结果均会为语言事实带来不同的关联方式,从而方便我们把既有语言表征理论的目的调整为现实预期目的。这是走向统一的自然智能框架的一个途径。
二 心理语言学发展的数据
类似上述观察证据和相关领域研究取得的证据尚不足以完全认定影响语言过程的神经认知因素、进化过程相关因素和发展过程相关因素。心理语言学研究所取得的数据则是最为直接的证据。Harley在2001年发表的语言心理学专著及其早期版本则直接在封面上使用了“由数据到理论”的题记,标志着该领域已经进入了数据倚重的研究阶段。就领域认识发展的一般规律看,各话题相关的研究一般自然经历三个阶段:理论分析阶段、实验验证阶段和数据建模阶段。既有研究经历了全部三个阶段,尤其是前两个阶段的研究已经教会了人们应当如何看待理论和数据,完善了人们关于语言及其研究的直觉。然而,第三个阶段需要打开语言认知和语言研究者认知的缠结,解开大脑拓扑空间和外部语言行为功能空间的缠结。我们在后文多个相关部分均涉及此中缘由。
(一)心理语言学数据的结构性
严格说来,心理语言学的数据十分广泛,包括语言过程的神经功能方式下的各个认知过程环节在可用技术条件下可以记录和收集的数值、词语、判断结果和行为特征。然而,具有建模意义的探测数据大致为三类:1)主体在语言过程主动输出数据的两个端口,即语言形式判断和语言理解决策,支持采集形式判断数据和语义决策数据;2)主体语言过程的被动响应数据:潜伏性数据和行为观察数据;3)作为语言过程产物的语料。另外一种陈述则为两大类数据:语言处理(包括听、说、读和写的认知过程)数据和语言理解决策(包括各种语言判断和认知介入的过程)的数据。
语言处理是我们在听、说、读、写等神经认知功能方式(尤其是听和说)的自动化的过程。语言处理的如下功能环境决定了心理语言学的数据关联:
图1.4 语言处理的功能环境
这样一个指称式仅仅反映了语言过程的数据智能结构性因子和共效因素,其中一些延长响应时,或者减少元素层面数量,比如心理限制和文化认知限制;另外一些加快响应时,或者增加元素层面的数量,比如频率。面对这样一种较为复杂的现实,心理语言学家究竟应该从何处着手来获得关于语言心理的较好的知识系统?第一种设想是:不大接受认知介入的过程就是比较自主的语言心理过程,而如果其他过程都相对于这个过程而成立,那么我们就可以把这个自动化的过程用作领域“根据地”,比如范畴听辨的反应时和句子分析的反应时。语言处理的核心过程就是像布洛卡区那样的言语产生以及像威尔尼克区那样的言语听辨、句子分析和句义理解的过程。其他过程的解释需要照顾上述核心过程的表现,即“听/说/读/写(音、词、句、篇)”的速度表现、脑生理电活动表现及其影响因素表现。第二种考虑是语言神经认知过程的现实性,因为这个过程直接基于进化智能结构,最为难以改变,例如超越了各种记忆容量或者处理宽度的“听/说/读/写(音、词、句、篇)”任务便会变得非常困难。第三种考虑是心理现实性,即注意控制及其转换方式对于意识和无意识过程的调用是衡量“听/说/读/写(音、词、句、篇)”任务的难易度的重要标准。我们认为这些考虑都统一指向某种以语言认知功能为术语的场合化智能。
在领域成形期,心理语言学需要各种凭据。什么现象具有客观性?哪些现象相对而成立?人们在语言处理过程中使用的各种知识、潜伏性数据等可以为我们回答关于语言的关键问题提供依据。
(二)语言处理数据
语言处理的数据具有各种类型。我们可以采集到什么数据,这在很大程度上对领域发展和现状会产生影响。在既有研究中,语言处理的数据主要为听、说、读和写的过程需要的时间、大脑相关电位活动、大脑处理语言的功能部位、阅读中的眼睛的前后运动、产物语言的特征频率等数据。既有面向语言心理的研究一般把语音、词、句和篇的处理按照神经认知方式分置于不同话题之下,含言语听辨、心理词汇的提取、句子分析和篇章理解。在各种实验条件下的认知则一般会偏离自然语言使用状态,并影响数据有效性。此种情况导致语言心理模拟与实验分道扬镳,分别支持一般语言智能和经验智能。
为了采集这类数据,实验设计的一个原则就是利用不同的技术方法来采集不同语言认知功能端口的数据。每一个功能端口都接受一组特定的因素(而不是任意因素)的影响。因而,另一个原则就是利用刺激和被试两个方面的选择严格控制变量,以确保数据中的差异的真正来源为所要观察的自变量,或者确保正确认可了数据模型中的实际存在的数据维度。在以语音(如语音识别和范畴听辨实验)、词(如词与非词判断实验和图命名)、语句(如语法判断、可接受判断和可取性判断)、语篇(如话题理解、篇章回述、代词前指判断)等实验中,人们可以采集的数据包括通过按键反应并且由计算机程序记录的时间、语言理解过程的事件相关脑生理电、阅读过程用眼动仪记录的眼球注视等。新的研究可以考虑各控制条件对于语言认知场合的模拟的价值。
(三)语言判断和决策的数据
语言使用者具有何种语言知识,为了回答这些知识在自然的语言处理条件下又是如何使用的这类关键问题,既有研究也非常重视各种语言判断任务、完形填空任务和语篇理解表现。一个语句是否合法,或者有多大的可能性是合法的,是否可接受,在多大程度上可取,对于这些问题的判断可以反映所用语言知识及其过程。相应数据的采集同样需要严格的实验控制。
在上述实验中,研究者一般并不是单独采集语言处理数据,例如在采集处理脑事件相关电位的实验中,在具体听读任务完成时施加一个是/否或者多级判断任务,并利用实验设备把具体判断结果记录下来。此种数据直接表明了被试究竟使用了什么语言知识和认知过程。此外,如果是单纯了解语言判断和面向材料理解的选择结果,研究者则可以利用录音呈现实验材料,利用卷面提取响应,还利用录音记录口头报告或者有声思维等。
(四)语料
口语和书面语料统计数据本身就是重要的心理语言学数据。人们可以建立大规模的语料库,也可以采集经过严格的变量控制的小型特殊语料库。原始的作法是标记语料库,然后统计这类标记项建立统计学模型或者概率模型,统计项可以为停顿、失误、词形、语块、句法结构等语言运用现象的类型和频率。既有研究取得了较为丰硕的成果,例如研究得出的词的频率本身就是一个语言功能价值分布的社会语言模型,大致再现了语言能力的运用状态。新的研究可以直接把各种词典作为特征单,利用工具软件把这些特征映射到语料库中。
语料采集技术包括录音、录像和书面语。其中录像主要用于研究儿童语言习得。不同语料要求不同的处理技术。然而,目前的研究似乎相对倚重文本处理技术,对语音和语义表征乃至行为层面的数据关注相对较少。
三 心理语言学数据用途
数据是作出理论判断、建立各种认知功能模型以及展现语言进化、发展和使用的智能的唯一依据。语言研究选题不仅要求认知窗口和认知功能窗口限制下的选题渐次走向“博大精深”的研究,也要求在数据模型经验的基础上建立良好直觉,基于智能这一认识框架的一些重要的选题均在这两种窗口可知范围之外。优秀的模型依赖其范畴控制合理的数据,即隐含维度高且表征清晰的数据。研究目的是预期高度发达的语言相关认知过程及其知识的心智构造。目前实验数据在主流设计上大多仅仅满足单项理论判断的描写和推论的需要,如t检验、相关性分析、单因素/多因素方差分析、多元回归分析以及各型神经网络对于多因子数据的统计。研究结果和结论接受方法的限制,即研究设计需要不同的专门知识。故此,建立模型的研究(尤其是早期的研究)不仅因此而与面向理论的实证研究分道扬镳,而且也因为建模方法范式和不同领域认识目的而出现彼此之间的区别。早期SHRDLU和ELIZA等语言处理模型便是如此。随着研究的深入发展,也日益显现出大规模数据工程的必要性。
既有研究产生的模型为:语音识别模型,旨在识别每一个音素和语流特征;神经语言模型,旨在反映各种失语症状中词语相互关系;语言(处理概率)模型,旨在把一个语料库的全部句子中的词归入特定的形式范畴;概率(决策)模型,旨在反映多级认知限制条件下的词的概率特征或在不同语言认知功能状态中的功能价值分布;潜伏语义分析模型,旨在表明各种表述层面之间隐显关系;神经网络语言发展模型,旨在反映多因素共现条件下输入与输出的多级相互作用效应。
随着运算技术不断发展,数据的用途愈来愈广。越来越多的心理语言学研究都把大量力气投入到具有重要理论和实践意义的数据工程。其中的一些模型甚至放弃采集现实数据,而是利用计算机的计算能力代之以自动生成的数据。Elman(1993)的研究便是采用这一策略。这一作法可以大幅度提高研究效率,促进该领域快速发展,因而将会在未来具有愈来愈重要的科学价值。
[1]通过对比,人们可以了解心智进化的功能凸显和不凸显的条件序列,以这些条件的术语确定行为(或者生命动态)的普遍规律;其次,语言可以具有一种相对于这些规律的最为完美的工具性表现,即各种相关因素功能通过发展过程的最优化;再者,拟声等认知策略具有一个相对于进化和发展的方便程度序列。最后,认知对于语言的介入具有必然性,即语言不仅需要伺服型的认知,也需要支持发展的认知以及体现一定社会和文化价值形态的认知。忽视这些认知介入,我们便难以有效解释儿童的发展过程和全体中个体的差异。但凡有经济性制约的系统,此种考虑不可避免。
[2]即语言各个相关方面的参差和协同都是认知的功能表现,尤其是认知发展中的功能表现。在此处采用的理解方式中,关注认知发展就是关注影响认知的条件和功能方式。
[3]即与语言相关的认知过程。
[4]界面知识是普遍的,不因个人差异而变化。理解的差异来自词的心理相对性,对于字面意思进一步解释的差异来自不同的缘由。源自心理相对性的理解差异是语言发展中智能经验化差异的结果,因此适合在智能层面寻找其限制条件。
[5]记忆的组织形式含过程性记忆和陈述性记忆(语义记忆)以及隐含记忆和明示记忆。在自然记忆状态下,回忆效果和回忆量是回忆延迟时间的一个函数。