导论
一、研究背景和选题来源
本研究是从言语治疗(Speech Therapy)的专业需求出发,针对汉语词汇语义表征进行的理论和实验研究,其研究背景和选题来源有以下两个方面:
(一)言语治疗的实践需求:治疗语料的选取与编排问题
施加刺激和观察行为反应,这是在言语治疗的临床操作中最常见和最基本的行为模式。它具体表现为治疗师向患者提供实物、图卡或语音刺激,要求患者实施识别、命名、归类、分拣、应答或叙述等操作,从而对功能障碍进行评估或训练(李胜利,2004,4-7页)。如果仔细观察这些任务,就会发现它们本质上都是交流行为。也就是说,以语言素材作为刺激源,患者通过听、说、读、写、表情或肢体动作接受刺激并做出反应,完成与治疗师的交流。每个治疗师在发起这种交流时,必须直面一系列问题:为什么要选取这些素材?它们应该按照什么顺序呈现给患者?它们预期要用什么方式调用患者的哪种感觉通路?又会刺激患者的哪些认知模块?
令人遗憾的是,实际应用于临床的言语认知治疗往往只强调刺激方式,而对语言素材本身缺乏应有的重视。例如,舒尔刺激法(Schuell’s Stimulation Therapy)是失语症最常用的语言功能治疗方法。该疗法认为,听觉模块是最重要的语言加工部分,同时是失语症的主要障碍所在,因而在操作上强调施加反复的、高强度的听觉刺激。又如,交流效果促进法(Promoting Aphasics’Communicative Effectiveness)是失语症最常用的功能性交际治疗方法。该方法利用接近实用交流的对话结构,在言语治疗师与患者之间双向交互传递信息。在操作时,把一叠图片正面向下放置于桌面,治疗师与患者交替摸取,但不让对方看见图片的内容,然后利用各种表达方式(语音、手势、绘画或书写等)把图片所含语义传递给对方,而接受者通过重复确认、猜测和反复质问等方式进行适当反馈。这些治疗方法都把语言素材视为随手可得的资源,并且默认治疗师仅凭自身经验和日常语感就可以选择合适的语料。治疗素材选择方面的粗糙性,往往被“个体化治疗”或“综合多样措施”等不具有操作指导价值的抽象原则所掩盖。
即使配备了素材,也仍然缺少依据来指导如何在治疗中合理安排这些素材。例如,在交流效果促进法实施过程中,治疗师如果拿到一张“大象”的图片,应该首先向患者传递哪方面信息呢?在患者做出反应后,又应该如何做出调整,选取下一步提示信息呢?表1展示了两段治疗师与患者的对话,其中治疗师通过提示患者说出概念的语义特征而帮助患者改善图片命名能力。人们可能很熟悉这种交流场景,因为不但在言语认知治疗中会如此,二语习得或幼童学语也会如此。就“交流什么”而言,治疗师需要在治疗开始前就设定需要命名的图卡(例如“大象”和“人耳”),还需要预先设定要提醒这些概念的哪些特征(例如,大象是动物、有鼻子)。就“怎么交流”而言,治疗师需要安排好图卡的出示顺序(例如,先“大象”,后“人耳”)和提示的顺序(例如先提示分类,后提示功用)。
表1 言语治疗师与患者在治疗过程中的对话
①患者情况:男性,49岁,右侧肢体活动不利伴言语困难近两年。患者于2013年2月25日突发右侧肢体不能活动,伴言语不清,急送医院诊断为“左侧基底节区脑出血”,经治疗后生命体征恢复平稳,但仍有右侧肢体活动障碍和言语不利。2013年8月25日至医院要求诊治言语障碍。经诊断为:脑出血后遗症期、右侧偏瘫、失语症(经皮质运动性失语)。此后每隔约六周接受一个疗程的言语治疗(每周五次,每次一小时,持续两周)。一年后,患者言语功能改善,转归为命名性失语。文中对话录制于2015年2月6日。
如果把目光放到二语习得,就会发现,人们应用词频法、联想法、字根分析法等手段,对词汇进行选择和编排,以期能提高学习效率。这从另一个侧面提示素材编排的重要性。如果把目光放到幼童学语,就会发现,人们最初获取的知识是基于切身体验到的共时和历时线索。前者如奶瓶和奶嘴一起出现、共同使用。后者如拧开水龙头会有水流出。这种利用时空线索获取知识的能力根植于人类认知能力之中,其认知成果在语言中的最直接体现就是语义。如果把这种认识拓展到言语治疗中,就又不得不考虑其基本问题。从词汇层面来看,这个问题可以描述为:如何根据词汇语义来选取和编排训练素材?从操作层面来看,要解决这个问题就需要对词汇语义进行质性分类和量化分析。
词汇语义特征分析已经成为一种实用型言语治疗技术。但是就语料选材和编排而言,这种技术也同样缺少有效的指导原则,也就在操作上无法摆脱对治疗师个人经验的依赖。在语言学中,词汇语义特征分析的理论和方法研究有着悠久的历史,但是其成果不足以直接移植到言语治疗中。主要原因在于,语言学的词汇语义特征分析,传统上是以专家内省形式为主,往往不提供经验性数据,而言语治疗学作为一门医学专业,是一门讲求经验性证据的学科。
值得注意的是,在欧美语言研究中,从20世纪70年代罗希(E.Rosch)的词汇语义特征量化分析开始(Rosch&Mervis,1975),通过采集经验数据集,对词汇语义特征进行质性分类和量化分析,已经发展成一个较为成熟的研究方向。马尔特(B.C.Malt)和史密斯(E.E.Smith)开创了语义特征间相互关系的量化分析进路,并且提出了对语义特征及其相互关系进行质性分类的思想(Malt&Smith,1984)。法拉赫(M.J.Farah)和麦克莱兰(J.L.McClelland)以视知觉和功用这两种类型为基础,通过采集和建立经验性语义特征数据集,推动了对词汇语义特征的质性分类研究(Farah&McClelland,1991)。麦克雷(K.McRae)、德萨(V.R.De Sa)和赛登博格(M.S.Seidenberg)建立了国际上第一个大型经验性语义特征分析数据集(McRae, De Sa,&Seidenberg,1997)。通过系列研究(McRae et al., 1999;McRae&Cree,2002;McRae et al., 2005),麦克雷等为这方面的实验研究提供了操作范例,并且确立了针对经验性语义特征数据集的分析范式。该范式以语义特征的质性分类和量化分析为主,以行为学检测数据为辅。尤其值得注意的是,麦克雷等的研究首次从行为学检测上证实,词汇语义的各个成分之间的关系对词义在人脑中的处理有着显著影响,因而对言语治疗具有重要的指导价值。具有紧密关系的词汇语义特征,可能在治疗过程中需要考虑其呈现的共时与历时关系。加勒德(P.Garrard)、拉尔夫(M.A.Ralph)、霍奇斯(J.R.Hodges)和帕特森(K.Patterson)等推动了基于经验数据集的量化分析指标的发展,并且证实概念之间仅凭语义特征的重叠关系,就足以形成概念范畴聚类(Garrard et al., 2001)。加勒德等还为分出“百科知识”这一语义类型提供了实证依据,推动了语义特征的质性分类研究。
在这些先驱研究的基础上,这些年来,经验性词汇语义特征数据集的采集和分析得到了长足发展,涌现出一大批成果。这些成果涉及英语(Vinson&Vigliocco,2002;McRae et al., 2005)、荷兰语(Ruts et al., 2004;De Deyne et al., 2008)、意大利语和德语(Kremer&Baroni,2011;Lenci et al., 2013;Montefinese et al., 2013)等多种语言。受试者来自健康人和先天失明者、青年人和老年人等多种人群(Lenci et al., 2013)。概念种类涵盖名物和动作事件(Vinson&Vigliocco,2002;Vinson&Vigliocco,2008)。与这些数据集的发展相适应,词汇语义特征的质性分类方案也得到了长足发展,先后出现了CM脑区分类法(Cree&McRae,2003)、WB知识分类法(Wu&Barsalou,2009)、KB-WB知识分类法(Kremer&Baroni,2011)、LB盲明分类法(Lenci et al., 2013)和模态定级法(Lynott&Connell,2009;van Dantzig et al., 2011;Amsel, Urbach,&Kutas,2012;Lynott&Connell,2013)等多种实用分类方案。尤其值得注意的是,勒巴尼(G.E.Lebani)和皮安塔(E.Pianta)专为言语治疗提出了LP康复分类法(Lebani&Pianta,2010b)。因此,欧美研究者在词汇语义方面的经验性研究成果已经为其言语治疗应用奠定了基础。
在汉语研究中,一些心理学或神经语言学研究也建立了经验性词汇语义特征数据集。例如,郑航月的《汉语概念的特征结构初探》(郑航月,2009)和许振国的《语义加工中汉语概念特征的差异性效应》(许振国,2011)都采集并分析了受试者提名的词汇语义特征。但是,这些研究通常沿袭范畴特异性语义损伤的研究旨趣,往往以生物和非生物概念范畴的比较为主,没有为汉语语义特征提出质性分类方案。李葆嘉开创了析义元语言研究(李葆嘉,2013),其研究路线明确提出,在经过专家内省形式的义征分析和义场建构之后,需要通过人群调查采集经验性数据来验证析义元语言数据集,从而为基于义征的语义量化分析体系提供了理据论证和实践指导。但是,析义元语言在语义特征的质性分类方案方面仍有待发展。迄今尚未出现专为汉语言语治疗设计的词汇语义特征分析方案。
如果从学科发展层面来看待这种分析模式的缺失,那么它可能源于学科视野的差异。神经语言学追求神经机制研究成果的证据力度,理论语言学强调理论体系研究成果的思想高度,计算语言学服务于“人-机”交流的信息处理技术发展。这些学科都没有为患者提供临床服务的使命与义务,因而也不会直接为“人-人”交流的言语认知治疗建立语义分析模式。但是,作为康复医学三大领域之一的言语治疗专业,在实践中必然要求造福患者,从而必然要直面具体的临床实践问题。
经过上述考察可以发现,言语治疗实践对语料选材与编排的内在需求,为本研究提出了现实问题和应用目标。词汇语义分析技术在言语治疗领域的发展,以及欧美经验性词汇语义特征数据集及其相关分析技术的进步,为本研究提供了可行的技术手段。汉语析义元语言的理论体系和操作模式,提供了符合汉语个性的理论和操作框架。但是,迄今为止没有汉语研究者从言语治疗的角度梳理欧美经验性词汇语义特征数据集的理论和技术成果,更没有研究者开发带有质性分类方法和量化分析指标的汉语经验性数据集,同时也就缺少经验性数据集和内省数据集的比较研究。这些研究的缺失,直接使汉语言语治疗停留在凭语感、靠经验来选择和编排语料的阶段。因此,本研究希望集语言学之法,解医学之需。
(二)语义研究的理论需求:语义系统维持效率性和稳健性的结构机制
在认识到上述选材和编排问题,并且也意识到需要寻求对素材进行质性分类和量化分析之后,必然要问:按照什么标准来选材和编排?对这个问题的解答,必然要遵循医疗的基本思维逻辑。依据正常对照来诊断和治疗疾病,是贯穿一切医疗过程的主导逻辑。目前言语认知治疗的直接理论依据,主要来自神经语言学和认知神经心理学的语言认知加工理论(Tesak&Code,2008,199-200页)。该理论把语义系统视为语言认知加工的枢纽环节,当一个或多个认知加工环节出现异常时,就会在听、说、读或写方面表现出相应的障碍,而语义系统的受损将会造成这些能力的全面障碍(Tesak&Code,2008,194页)。对语义系统刺激和训练是言语认知治疗的最基本策略。这意味着,如果将上述医疗原则应用于语言研究,就必须构建一套分析方案指导建立可操作、可测量和可比较的语义系统模型,用于常人和患者的比较。这是语义研究的重点与难点所在,而语义网络建模和分析有望成为解决该难点的手段。
在《现代汉语析义元语言研究》中,李葆嘉剖析了词汇语义分析的理论基础,梳理了词汇语义分析的国内外发展脉络,总结了面向信息处理的语义网络模型,并为之提供了详细的技术路线和实施范例(李葆嘉,2013)。虽然这个语义网络模型是为计算机自然语言处理所设计,但它为汉语词汇语义网络研究提供了完善的理据论证和框架设计,因而可以拓展到面向言语治疗的汉语词汇语义网络研究。两者的差异在于,析义元语言更强调词汇语义和句法语义这两个层面的贯通,而面向言语治疗的词汇语义网络研究主要关注的是词汇语义层面。原因在于,大多数接受言语治疗的患者,其言语障碍主要表现于词汇语义层面,例如命名障碍或用词错误。或者说,对患者而言,完善的句法表达可以是美好的愿望,但至少它还不能成为临床言语认知治疗的现实追求。
遵循以常人为对照的原则,面向言语治疗的词汇语义网络研究,需要以健康人的认知功能特征为基础,确定研究的立足点。常人对语义的表征和处理,可以实现快速、有效且稳定的交流。人们可以迅速切换话题,可以在呼吸容量限制下用有限的音节说出想说的任何内容,而且不会因为遗忘某些内容、学习某些新词、放弃某些旧概念或旧词,或者学习一种新语言,而导致整个语义系统的崩溃。这种可以高效存取信息,而且永不“死机”的系统组织和维护模式,具有高度的适应性。现有的任何一种计算机系统都无法做到这一点。这或许是人类心智的秘密所在。观察失语症或痴呆等交流障碍患者,可以发现,他们的这种适应性明显降低。如何用语义模型来反映和度量这种特点?能否利用语义系统的这种特点来改善患者的交流能力?
出于上述认识,本研究拟从维持词汇语义系统效率性和稳健性的结构机制出发,寻求言语治疗语料的选材和编排方法。目前的语义网络研究进展已经揭示,词汇语义网络的宏观结构模式是语义系统具有效率性和稳健性的基础。20世纪60年代,奎廉(M.R.Quillian)对语义网络建模的早期研究,是通过解析概念的语义特征来分析语义处理的层次结构的,并未关注语义网络的宏观结构模式(Quillian,1968;Collins&Quillian,1969)。自此以后,冠以“语义网络”之名的文献报道可谓汗牛充栋。但一般网络模型研究领域发展的滞后,使得对语义网络宏观结构模式的研究,数十年没有任何实质性进展。语义网络往往只是一种隐喻而不是研究工具。直到20世纪末,以因特网的复杂网络模型为突破,发现了复杂适应性系统普遍具有的一些宏观网络模式,例如异质性和小世界性。这些模式可以解释和测量系统的效率性和稳健性(Watts&Strogatz,1998;Barabási&Albert,1999)。以此为契机,2001年,费雷尔坎修(R.Ferrer i Cancho)和索尔(R.V.Solé)首次报道,常人的语言系统在词汇组织方面具有支持适应性存储和快速提取的某些结构模式(Ferrer i Cancho&Solé,2001),并且提出言语交流障碍可能是这些模式受损所致。此后,随着网络科学(Network Science)这个新兴学科的发展,复杂网络建模开始成为重要的语义网络研究工具(Solé et al., 2010)。但是,由于对“语义网络”这一术语缺乏统一认识,造成同样以“语义网络”为名的复杂网络模型实质上针对的是不同的关系结构,例如联想关系(Steyvers&Tenenbaum,2005;Bales&Johnson,2006;林枫、贺丹军、江钟立,2009;Morais, Olsson,&Schooler,2013)或动词语义指向关系(Liu,2009)。深入到语义特征层面的语义复杂网络建模研究目前只有两个:博吉(J.Borge)和阿瑞纳斯(A.Arenas)基于语义特征重叠关系建立词汇网络,分析概念间的语义相似性(Borge-Holthoefer&Arenas,2008);希尔斯(T.T.Hills)等采用了类似的建模方式研究儿童语义网络的发育机制(Hills et al., 2009)。
经过以上考察可以发现,言语治疗在临床实践中需要遵循常人模式来选取和安排语料,以期患者能够重塑这些模式。在复杂适应性系统的普适网络结构模式研究方面的突破,使语义网络不再是一种隐喻,而有望成为建构常人模型、测度病理模式的工具。据此,本研究提出假说:语义系统是具有效率性和稳健性的词汇语义特征复杂网络。但是,由于存在研究视野差异和学科技术壁垒,一方面语言学领域不熟悉网络科学的基本思维模式和技术范式,另一方面网络建模技术发展较为成熟的领域(例如物理学)不熟悉语言学理论,从而造成前者未能有效应用网络建模工具,而后者则又有滥用它的风险。建立面向言语治疗的词汇语义网络建模与分析方案,需要把语义系统理论上的宏观结构模式与现实中的认知功能表现统一起来,从而既丰富认知语义网络研究的理论体系,又拓展言语治疗实践的技术体系。值得注意的是,迄今尚未有深入到汉语词汇语义特征层面的复杂网络建模与分析研究。也没有研究者从网络科学的思维模式和技术范式出发,对语义网络的研究脉络进行梳理。更没有研究者出于理论自觉,从语言学理论出发,为言语治疗设计语义网络研究方案。因此,本研究希望填补上述缺失,为言语治疗提供带有理论自觉和实证依据的语义学研究成果,做到鉴医学之用,求语言学之理。
二、研究目标和研究方法
本研究的对象是汉语词汇语义网络。研究旨趣并非指向“人-机”交互的自然语言机器处理,而是面向“人-人”交流的医患诊疗互动。本研究的整体目标是为言语治疗建立语言学视角的汉语词汇语义表征分析方案(简称医用语义分析方案)。与上述两方面研究背景相对应,本研究需要实现以下两个目标:①建立面向言语治疗的汉语词汇语义特征采集和分类方案;②探索常人词汇语义特征的宏观网络模式,从结构上解释语义系统的效率性和稳健性。这两部分相辅相成,前者为后者提供语料,后者为前者提供基于常人模式的选材和编排准则,最终形成贯通“原始数据采集和整理→义征质性分类标注→义征量化指标计算→网络参数估计”这四个要件的完整的汉语医用词汇语义分析方案。
本研究总体上采用理论分析与实验探索相结合的研究模式,综合采用以下几种方法:
1.文献整理和理论综述相结合:回顾已有文献,梳理理论脉络,在三个方面提供理据论证:①作为言语治疗手段的语义特征分析技术的发展过程和制约因素;②欧美经验性义征数据集及其定量定性分析的学术沿革;③语义网络建模的多学科理论依据。
2.内省分析:①在内省分析的基础上,结合前人成果,设计汉语语义特征质性分类方案;②对汉语析义元语言数据进行精加工和标注;③对经验性义征数据进行解析和标注。
3.实验求证:①招募汉语普通话受试者,实施语义特征提名任务,采集经验性义征数据;②采集认知功能障碍患者实例,对医用语义分析方案进行实例验证。
4.量化与可视化分析相结合:①采用统计图形,展示量化分析结果;②建立语义网络模型,把网络可视化技术和网络参数估计相结合,对语义网络宏观结构模式和局部结构参数进行计算和剖析。
5.数据描述与统计检验相结合:由于语料来源有内省和调查两个来源,而这两个来源都无法做到排除随机因素影响。或者说,由于实验现实的限制,分析素材的采样往往具有便利性,仅凭数据描述无法得出可靠的结论。因此,需要有针对性地处理便利数据,以减少随机误差,使分析结果具有统计效力。本研究以重采样自举法技术结合置信区间检验技术,对义征网络模型的宏观结构模式进行验证。
三、研究内容和语料来源
本研究主要包括以下具体任务:
1.回顾词汇语义特征分析的言语治疗应用现状,揭示现有问题和需求,确立研究目标,以及目标的四个要件:原始数据采集和整理、义征质性分型标注、义征量化指标计算和网络参数估算。
2.回顾语义特征数据集的发展历史和研究现状,总结数据采集和处理方法,整理现有的义征质性分类方案和量化分析指标。
3.确立本研究的认识论基础,提出基于常人语言能力的语义网络结构假说,并从五个方面(语义语法学、词汇语义学、生态心理学、认知心理学和网络科学)提供理据论证。
4.确立义征质性分类、量化分析和网络建模的方法论依据。
5.设计和论证面向言语治疗的汉语词汇语义特征质性分类方案。
6.设计经验性汉语词汇语义特征数据集的构建方案,并建立小型的汉语名物义征数据集。
7.比较经验数据集与内省数据集,分析人群调查和专家内省在义征分析方面的异同,探索义征分析和义场建构所遵循的认知规律。
8.构建适于析义元语言和经验性义征数据集的义征复杂网络模型,分析义征网络所具有的效率性和稳健性模式,论证基于义征数据集的言语治疗策略。
9.采集患者语料,应用本研究建立的词汇语义分析方案进行分析,论证方案的应用价值。
本研究使用的资料主要来自两个方面:
1.文献报道且可公开获取的语料,主要包括两个部分:①汉语析义元语言数据集(李葆嘉,2013);②欧美经验性义征数据集:2005版英语名物义征库(McRae et al., 2005)、2008版英语名物事件混合义征库(Vinson&Vigliocco,2002;Vinson&Vigliocco,2008)、2004和2008版荷兰语义征库(Ruts et al., 2004;De Deyne et al., 2008)、2011版德语和意大利语双语对照义征库(Kremer&Baroni,2011)、2013版盲人和常人意大利语双样本对照义征库(Lenci et al., 2013)、2013版意大利语义征库(Montefinese et al., 2013)。
2.自行采集语料:以60个概念(分为两个领域,每个领域五个范畴,每个范畴六个概念)为刺激材料,利用语义特征提名法采集常人和患者语料。40名女性和42名男性(平均年龄20.62岁)参与常人语料采集,从中提取6585条带有征型标注的义征,形成汉语名物义征简单集。患者语料来自一名视觉对象失认症合并失用症的患者,在言语治疗前后分别采集一次数据。
四、技术路线和主要结论
本研究需要集合医学、语言学和网络科学等多个学科的理论和技术。要做到既博采众长,又去伪存真,既求同存异,又兼收并蓄,必然会带来操作上的复杂性和工作量上的繁重性。因此,必须整体规划,有序进行。技术路线如图1所示。
图1 技术路线图
在行文安排上,第一章主要是文献综述和现状分析,从而确立研究的本体论立场。该章关注的是义征分析技术在言语治疗中的应用状况和现有问题,剖析语言学义征分析研究的两条进路及其源流,并且重点梳理欧美经验性义征数据集的发展过程。同时,第一章还围绕复杂网络研究,对语义网络建模加以综述,揭示义征数据库的语义网络建模价值。第二章确立研究的认识论基础,从常人语言的效率性和稳健性出发,提出并论证语义系统的网络结构观。第三章确立研究的方法论依据,对义征质性分类、量化分析和网络建模技术进行梳理。第四章以内省数据集(现代汉语析义元语言数据集)为基础,初步建立从数据整理、质性分类、量化分析到网络建模的四步分析方案,并且探讨内省式义征分析所遵循的认知规律,指出内省分析数据集在言语治疗应用上的优势和局限性。第五章设计并论证面向言语治疗的汉语义征质性分类方案。第六章以自建的经验数据集为基础,通过数据采集和标注、定性定量分析和网络建模,从而正式确立汉语词汇语义分析方案,并且论证该方案在言语治疗中的应用价值。第七章以患者数据为基础,验证所建分析方案的实际应用价值。
本研究的主要结论如下:
1.面向言语治疗的词汇语义分析方案,应当包括四个连贯的要件:原始数据采集和整理、义征质性分型标注、义征量化指标计算和网络参数估算。
2.通过义征提名任务,从人群中采集义征提名数据和析出义征条目(原始数据采集和整理),从定量(量化指标计算)、定性(质性分类标注)和征间关系(网络参数估算)三个方面进行精加工,可以构建面向言语治疗的汉语经验性义征数据集。对内省数据集进行同样的处理,则可以与经验数据集形成互补,应用于言语治疗。
3.面向言语治疗的汉语词汇语义特征质性分类方案包括两个层次:底层语言学分类方案和表层临床衔接方案。前者直接用于义征分型标注,后者把标注后的义征类型根据脑高级功能模块进行分区。这种双层设计使语言学研究者专注于底层的义征分析与标注,而使言语治疗师可以直接把义征分析结果应用于诊疗实践。
4.词汇语义特征的数据结构可以反映语义认知规律。在概念聚类方面,仅凭义征重叠关系就可以形成符合日常体验的概念范畴。在义征解析方面,人们通常首先从范畴分类和功用信息入手实施概念语义解析,但每个概念在整体上都有范畴特异性的征型表达谱。征型表达谱相似的概念,通常在语义聚类时距离相近。
5.无论是汉语析义元语言还是经验性义征数据集,都可以借助义征之间的概念共现关系构建复杂网络模型,探查网络的宏观结构模式。这些模式可以解释语义网络在功能上的效率性和稳健性是如何从局部征间关系中涌现出来的。同时,与特定模式相对应的数学模型(例如乘积模型导致对数正态分布),有助于解释形成这些模式的认知机制。
6.面向言语治疗的汉语词汇语义分析方案可以指导建立常人语义特征数据集,使言语治疗师可以从不同角度(独有度、优势度、线索度、示意度、可达度、显著度和拉普拉斯度等)选取和编排概念和义征。同时,该分析方案还可以指导如何采集和分析患者的语义特征数据,绘制疾病状态下的语义特征类型表达谱,从而有助于评定患者的功能状态,指导言语治疗。
五、主要成果和应用前景
本研究的主要成果包括:
1.理论成果:对词汇语义表征研究进行了理论整合,确立了词汇语义表征复杂网络研究的认识论基础和方法论依据。借鉴前人的义征质性分类方案设计思路,依据生态心理学、神经心理学和语义语法学,制订了面向医学应用的汉语义征质性分类方案。
2.实践成果:把复杂网络建模与分析技术应用于语义表征研究,并且把义征提名技术应用于汉语研究。为汉语经验性义征数据集的构建提供了可操作、可量化和可分析的方案。
本研究所建立的面向言语治疗的汉语词汇语义分析方案,主要有两方面应用前景。
一方面,为医学实践提供语言学基础研究支持。在这一方向上,欧美语言学研究在经验性义征数据集的研发方面开辟了一条较为成熟的进路,其与临床言语认知治疗的汇流已是顺其自然。在我国,由于长期以来实行理、工、农、医的学科划分,交流科学和障碍学(Communication Science and Disorder)相关的学科都划分为文科,需要从事言语治疗的医疗卫生工作人员则置身于医科。掌握了语言学知识的研究者没有执业资质接触患者,而直接为患者提供服务的治疗师又难以获得系统的语言学训练。由此造成的学科壁垒,使得要在汉语言语治疗领域设计和实施语言学基础研究有一定的困难。此类研究要具有服务患者的理论自觉,而这正是其理论价值所在。
另一方面,拓展语义语法学的理论视野和应用范围。长久以来,对语言病理现象的研究,在语言学领域被划分为病理语言学与神经语言学的研究范围。一般语言理论的研究,近年来主要集中在面向智能机研制的自然语言处理方向上。语义语法学对语义网络工程的最初设计也是如此(李葆嘉,2007a)。但是,这并不意味着语义语法学的理论成果不能应用于医学实践。事实上,语义语法学在建立过程中对语义网络研究的理据论证和操作设计,为面向言语治疗的自然语言分析技术提供了语言学依据。语义语法学在汉语析义元语言数据集方面的研究,为符合汉语特色的言语认知治疗技术的发展提供了语义分析范例。经验性义征数据集的研制,不仅要采集数据,还包括了研发者对原始数据的深加工。这种深加工推动了义征质性分类方法和量化分析指标的发展,而这种发展成果可以充实到语义语法学的理论体系中。义征网络建模又是对义征数据结构的再次建构,有助于探索义场建构和义征分析所遵循的认知规律。这些都将拓展语义语法学的理论体系和应用范围。
总而言之,在理论方面,本研究为现代汉语建构了词汇语义特征质性分类和量化评估的理论和方法,开拓了词汇语义表征研究的言语治疗学视野,为建立具有语言学理论自觉的言语治疗技术提供了思路。在实践方面,本研究提供了汉语经验性语义特征库的建构路线、数据实例和分析范例,既为今后语言学领域的语义分析提供了新型素材和方法,也为今后医学领域的诊疗操作和认知科学领域的实验研究提供了新型工具和手段。本研究所建立的数据集还可以嵌入应用软件,既有助于研发计算机辅助的言语治疗或对外汉语教学设备,也有可能为语义形式化处理提供新工具。另外,本研究为跨语种的义征数据比较提供了汉语样本,有可能为推动具有普适价值的语义语法学理论提供新证据和新观念。