二 庞大的家族,众多的人口——词汇单位的范围
就像一个成年男性娶妻生子,之后子又有子,子再有孙,逐渐形成一个庞大的家族一样,语言的词汇也是先有字(或词根),之后通过字与字的组合,不断衍生出新的词汇单位,从而形成该种语言的词汇。
汉语词汇在历史上曾经有过一个以单字为主的阶段,但现代汉语中除由单字构成的词汇单位外,更多的是由复字构成的词汇单位。复字词汇单位中首先要提到的是词,尤其是合成词。合成词,它们或者是由在语法上被称作粘着语素的字相互组合成的单位,又或者是由被称为自由语素的字与被称为粘着语素的字组合成的单位,或者是由被称作自由语素的字相互组合成的单位。粘着、自由,都是从其与另一字的结合关系的角度着眼的,如果从其自身的性质上着眼,粘着字、自由字都具有同样的性质:绝大多数是有义字,少数是无义字或弃义字。比如“蝌蚪”的“蝌”要依附于“蚪”而存在,“蚪”要依附于“蝌”而存在,“蝌”和“蚪”都是粘着字;但是“的士”的“的”却有相当大的自由度,它不但可与“摩、板、哥、姐”另组“摩的、板的、的哥、的姐”等词语,还可在“从东城打一个的到这里才几块钱”的组合里独用。因此可以得出这样一个结论性的认识:粘着字其实未必就是无义字或弃义字,有的也是有义字;自由字其实不一定就是有义字,有的也是无义字或弃义字。
从字与字结构而成的单位看,语言中有为数不少的由有义汉字与无义汉字或弃义汉字组合成的单位(如“狼狈、网吧”),它们同样得称作合成词,不能或无法称作单纯词,因为无论怎么说,它们都是由有关系的构件结构成的一个结构体。合成词固然绝大多数是由双字构成的,三字组合单位也有着与双字组合单位类似的性质特点,同样具有词的资格。合成词最多的是双字格的,其次是三字格的,如“亚健康、戴高帽”,也有超过三字的,如“自来水笔、无后坐力炮”。
复字词不等于合成词,复字词中还有为数相当可观的由若干个无义汉字或弃义汉字凑成的单位,也就是复字单纯词。其中由无义汉字与无义汉字凑成的复字词一般是双字的,这就是所谓的联绵词,如“颟顸、觊觎”;由弃义汉字与弃义汉字凑成的复字词,没有硬性的字数规定,这就是所谓的外来词,如“克隆、雷米封、歇斯底里、布尔什维克”。汉语中少有由无义汉字与弃义汉字组合成的单纯词,或由无义汉字与弃义汉字组合成的合成词。
合成词也不完全是复合词,它可分为两类:一类是复合词,词的所有直接组成成分主要是词汇性的,如“电脑、里外”;另一类是派生词,词的直接组成成分既有词汇性的又有语法性的,如“老鹰、钳子、丫头家、乡巴佬”。复字词汇单位中另一个常被人提起的大类就是熟语,它包括典雅的成语(如“黔驴之技、买椟还珠”)、俗白的惯用语(如“到哪说哪、空手套白狼”)、歇后语(如“张飞穿针——大眼瞪小眼”“武大郎放风筝——出手不高”)、谚语(如“人误地一时,地误人一年”“花配花,柳配柳,破粪箕,配笤帚”)以及介于雅俗之间的格言(如“生命在于运动”“得民心者得天下”)、名言(如“发展才是硬道理”“人人为我,我为人人”)和警句(如“宁停三分,不抢一秒”“火警就是命令”)。复字词汇单位中还有一类,它们是由词与词构成的固定组合体。这种固定组合体不像熟语那样表示一个较为完整的思想,而是表示一个特定的概念;也不像熟语那样传承久远,而是近代以来创造的。这种表示一个特定的概念的历史并不悠久的表意直白的固定组合体,借用一个现成的说法,可称之为仂语,如“麻醉疗法、全息摄影”。
词汇单位有典型和非典型之分。典型的词汇单位,是有意义且可独立使用的字(如“天、好、打、很”)、词(如“委员、奋斗、共和国、安全岛”)、仂语(如“和谐社会、海峡两岸、八三四一部队、六一儿童节”)、熟语(如“醍醐灌顶、优柔寡断、死猪不怕开水烫、老鼠进风箱——两头受气”),它们都是词汇现实性的使用单位;非典型的词汇单位,是无意义的或虽有意义却不能独立使用的字(如“骆、蝌、榄、芙”和“睫、皿、肤、恧”)、无意义的字串(如“布达拉宫”的“布达拉”、“鄂伦春族”的“鄂伦春”)、可称为“待嵌格式”的词汇性的架构(如“连……带……”“一……再……”“有……无……”“左……右……”),它们都是词汇非现实性的备用性单位。