第四节 词和短语的区分与判定
常用单音节手部动作动词的多功能性是它的一个显著特点,本研究将会考察这些词独立使用和参与构词的情况。由于北大现汉语料库是一个生语料库,未对词性进行标注。在抽样得到的语料中,既有动词作为语素参与构词的情况,又有其单独使用与其他词组合成词组的情况。要想把这两部分语料区分开来,首先就面临词和短语的界定问题。
词和短语之间的界限有时并不清晰,这是一个复杂的问题,不少学者对此进行过论述,但是依然存在着不少争论。
现代汉语本体研究中常见的划分词和短语的原则与方法,大致可以分为以下几种。
(1)从意义的组合关系来判定
词的意义有整体性,即它的意义不等于语素意义的简单相加,如“白菜”,不是“白”和“菜”的意义相加。短语的意义一般是组成短语的几个词的意义相加而成,如“白布”,泛指一切白颜色的布,其意思是“白”和“布”的相加。
(2)从能否扩展来判定
词的意义具有整体性和凝固性,在结构上不可再插入其他成分。而短语的组合具有临时性,内部结构松散,中间可以插入其他成分。这种判断词与短语的方法叫“扩展法”,又叫“插入法”。如“老虎”不能进行扩展,是词;“老人”可以插入“的”字成分,且插入之后,意思基本不变,所以“老人”是短语。
(3)从是否有非自由语素来判定
若一个结构中有非自由语素的存在,则一般是词。如“骨头”“钉子”“人性”“异化”等词中含有“骨”“子”“性”“化”这些不自由语素。“慨叹”“语言”等词中的两个语素都不是自由语素,可以判定它们是词。
此外,王宁(1999)从本源双音词结合的角度,提出了区分词和短语的几种方法:①非自由词素鉴定法;②非词源意义鉴定法;③非现行语法鉴定法;④非语义搭配鉴定法。
王宁(1999)提出的“非自由词素鉴定法”与常见的判定标准中的第3条完全相同。“非词源意义鉴定法”可以说是对“意义组合关系”这一标准的提炼和升华。“非现行语法鉴定法”和“非语义搭配鉴定法”则补充了常见标准以外的新的判定条件。可以说王宁(1999)提出的4种方法较为全面地概括了词和短语的鉴定标准,可以作为本研究判定词和短语的依据。
此外,近年来,大型辞书的编写对词性也越来越关注,《现代汉语词典》(第5版)就提供了词性标注,这也为词和短语的判定提供了辞书依据。
本着方便研究的目的,在语义上采用王宁(1999)提出的4种方法作为标准,同时参考辞书的词性标注来区分词和短语。以上原则可以概括为“依据语义、参考辞书”。