第三节 辞书强国,理论必超强
1.3.1 辞书理论概况
在多种现代科学,特别是语言学的推动下,从20世纪60年代前后,欧美词典学进入了现代科学行列。仅仅是《法语宝库》到1969年就用现代理念和手段搜集相关语言学资料50000多篇/部。现代辞书科学新理论的产生,强国主要通过5条途径:升华、继承、借鉴、移植、创造(爱因斯坦:思想的自由创造)。
他们的辞书编纂科学理论起码具有下列6个特性:(一)理性,(二)本质的整体性,(三)内在的逻辑性,(四)多维的系统性,(五)结构的和谐性(这是爱因斯坦强调的),(六)多元论(奥地利籍伯克利加利福尼亚大学教授P.K.Feyerabend/费耶阿本德的主张),而不是一元论(Th.库恩的观点)。从编纂实践上升为理论,必须经过范畴化(categorization)。Lakoff(1987:5)认为“对我们的思维、感知、行动和言语来说,再没有什么东西比范畴划分更基本的了。”范畴是知识网络的网结,是认知的枢纽,是理论的支撑点阵。范畴体系,就是理论。如何范畴化?辞书强国主要通过6种程序:经典范畴化,原型范畴化,提取最主要的区别特征,用最简明的词语、公式或模型表达范畴特征或属性,借助多种思维方式,尽可能杜绝一切直觉、内省简单枚举。
我国辞书理论研究的成果现状,可以概括4类:(一)综述型。对前人(古、今、外)理论予以介绍、归纳、概括、总结,并举例说明。(二)跟踪型。对前人(主要是外国的)某一理论予以阐释、分析、应用——描写、解释某些现象。(三)创新型。在前人基础上提出新观点(如理念演绎辞书、同场同模式等)、新原理、新规律或新法则等。(四)引领型。提出新理论,国内外许多学者引用、赞同。我们的现状是:综述型、跟踪型较多,创新型很少,引领型尚未出现。
国内辞书界有真知灼见的人很少,许多人还是盲人骑瞎马,瞎子摸象,问道于盲,瞽者论日。于是不可避免的,在一定范围内便形成5“瞎”:编纂者瞎编,编辑者瞎审,出版者瞎出,读者瞎买(尤其在二渠道市场,辞书像洪水猛兽般地扑来,买卖者都以钱为中心),评论者瞎评。已经达到令人目不忍睹,耳不忍闻的地步。
在这般情况下,必须极力倡导:理论先行。
一个国家,要富强,理论必须先行。英国从封建王朝跃进到“日不落”帝国,导源于亚当·斯密的《国富论》。英国曾经做过民意测验:现代英国打败入侵之敌的首要功臣是谁?多数人的答案:不是国王,也不是首相或元帅,而是亚当·斯密。
同理,辞书理论,是辞书科学动力的第一要素。只有辞书理论,才能增加辞书科学的知识总量。这正如一位哲人说过的:“科学从根本意义上说就是理论”。
1.3.2 辞书强国研究的热点理论
要成为辞书强国,辞书原创理论必须先行,尤其是必须输出领先的辞书理论。必须树立新观念:理念演绎辞书,理念领跑辞书,理念提升辞书。否则,辞书只能在低层次上循环。现代辞书编纂,首先不属于经验范围,而属于理性范围。《法语宝库》主编伊姆斯认为“搞不好词汇学也不能搞好词典学”。当前辞书强国研究的热点理论有12个:1.实用主义、规范主义、描写主义六种主导思想及其有机结合问题;2.解码词典和编码词典的对比和融合问题;3.传统释义方法、新兴释义方法及其综合问题;4.辞书元语言研究及其应用;5.语料库研究及其应用;6.辞书的信息处理与计算词典研究;7.辞书编纂现代化和辞书的电子化研究;8.辞书网络化研究;9.语言和各种知识词典化研究;10.国际辞书比较研究;11.读者需求研究;12.各国辞书史研究,先进经验吸收和借鉴研究。限于篇幅,这里只能简单谈谈前5个问题。
1.3.2.1 六种主导思想及其有机结合问题
(1) 实用主义。世界各国最早的辞书“难词词典”“双语词典”都凸显了实用主义,后来以“学习词典”为代表的一些辞书也在不同方面和程度上体现了实用主义。辞书的“实用”有多种:读经、释难、翻译、正音、正形、辨义、识字、用词、选词、查考、推广标准语……一本辞书最好突出一两个“实用”目的,适当兼顾其他。
(2) 规范主义(或规定主义)。规范,就是标准化,是对实用、描写的积极规约,是各国古今共同语的社会性需要。《英语词典》(约翰逊)、《法兰西学院词典》、《俄语详解词典》、《俄语词典》(奥热果夫)、《俄语词典》(科学院)等等辞书都贯彻了规范主义。它们显示了多种规范原则:非逻辑原则(不能用狭义的逻辑苛求活生生的语言),历史原则(承认语言的历时演变),习惯原则(从俗从众),系统原则(兼顾个体及其相关系统),科学原则(合于历时和共时学理或规律),功能原则(最能体现语言的功能的单位是首选),权威原则(权威的文本、用法常被公认),刚柔原则(语言要素的取舍、推广范围等都要注意刚柔),民族原则(外来词多民族化),国际原则(术语宜国际化),准确原则(能指应无偏差),经济原则(用较短的形式反映较多的内容)。历史告诉我们,上述这些原则,都是互相关联的。少数是双向关联,多数是多向关联。一本辞书常兼顾几个原则,适当照顾其余。
(3) 描写主义。韦伯斯特《美国英语词典》和《韦氏第三版新国际英语大词典》等词典以描写为主,兼顾实用和规范,描写给实用提供了多种可能性,给规范提供了标准化的广泛基础。强国辞书中的描写,都尽可能地反映语言单位的5方面情况:(1)词音——语音常体及变体,现代标准音,古旧音,方俗音,书面音,口语音,重音,轻音,变音;(2)词形——词形常体及变体,古旧形,方俗形,常用形,罕用形,讹误形;(3)词义——词义常体及变体,现代语言义,古旧义,方俗义,常用义,罕用义,言语义;(4)语法——词的语法常体及变体,词性及其活用,常规及变异形态,句法标准功能及变异;(5)语用——词的语用常体及变体,音形义的修辞用法,从言语向语言的过渡用法。
(4) 历史主义。19世纪70年代出现的青年语法学派正式提出历史主义,强调语言是随时间变化的现象。辞书的历史主义,主要体现在多个方面:收词求全,词形尽录无遗,词音古读、今读、异读等尽列,适当反映词族史,书证依据时序,释义遵照历史原则。代表作有:《德语大辞典》(格林词典)、《牛津英语词典》、《日本国语大辞典》、《汉语大词典》。它们都具有特别明显的词库性和研究性。
(5) 理性主义。这里的“理性”和“理性主义”都是广义的:是指在思想文化各领域推崇符合科学逻辑思维,反对神秘主义、信仰主义、直觉主义等非理性主义。辞书的高低悬殊,主要在于设计师的理念。理念的不断更新,推动了辞书的不断发展。理性主义辞书中小型的代表作,主要有:简明牛津词典、小罗贝尔词典、俄语词典、现代汉语词典,还有现代的义类词典、词源词典等。它们都是在现代词汇语义学驱动下产生的,都突出了多维理念、整体理念、元语言理念、语料库理念等等。
(6) 功能主义。在语言学和哲学影响下,词典学的功能主义,自20世纪40年代以来,一直在形成和完善着。其突出代表是英、法、德、美、俄、日等国家出版的多系列学习词典。它们至少包括以下功能理念:用户本位,功能词典(functional dictionaries代表语言的样本,再现语言模块),编码(注重语言的生成),用法中心论,注重语法(词法和句法)功能、语用功能,虚词释义更注重其功能和分布特征,语料库的产出和验证功能,元语言简化,义项简化、细化,配例注重语用示范,把繁难语法描述变为简明公式,尽可能实现语言的交际、表达、描述等多种功能。
一本好的辞书,不可能同时平均用力贯彻六个主义,而是以一个为主,兼顾一两个。
1.3.2.2 解码词典和编码词典的对比和融合问题
比起解码词典,编码词典至少有8个要素:(1)二语习得的新理念,(2)词目、义项的常用性,(3)义项划分的精细性,(4)释义中心的凸显性——词的用法,(5)元语言的可控性,(6)释义的综合性,(7)例证的语用性,(8)语料库的本源性,(9)读者本位性。本节只简要论述1、2、3、4、7、9各点(余者容后文论及)。
(1) 吸收了二语习得新理念
双语词典是学习词典的前奏。促使学习词典产生的第一个理念,就是L2习得的新理念。二战以后学习英语,成了战后的当务之急。因而产生了学习英语的新理念——把词作为语义、语法、语用统一体,突出语用,提示惯用法。L2习得的转向,强调在正确性(correctness)基础上更突出得体性(appropriateness),于是1948年演绎出世界上第一本外向型、学习型词典——Oxford Advanced Learner's Dictionary of Current English(《牛津高阶当代英语学习词典》由Hornby主编)。20世纪70年代进入信息时代,英、法、美、德、俄中涌现了十多套编码词典。中国至今没有一本理想的编码词典。
(2) 词目、义项的常用性,编码词典中的常量、变量和足量
词汇是变量,词汇核心是常量。各种、各类、各层次的语言交际,都共有一个基础词汇常量——约三五千个词。这个量,基本可以读懂、听懂书面语和口语。例如,根据Fries统计,英语常用词4000~5000个占书面语用词的95%,最常用词1000个占书面语用词的85%。(《词典编纂的艺术与技巧》301)掌握汉语3000常用词,就能懂得一般语言材料的86.7%。(《现代汉语频率词典》1490)由此演绎出《基础法语词典》《基础英语词典》《常用词词典》《教学词典》等。这些常量,是学习词典的主体或核心。
词的基本语言意义是词义的常量,词的言语意义即语境意义是词义的变量。学习词典以描写词义的常量为主,也要照顾词义的变量。
义素也有常量和变量之分。义素常量指核心基本义素,义素变量指非核心非基本义素即次要并受语境制约的义素。对一个一个词位及其义位来说,这个变量常因人、因时、因地、因事而变。就一个义位来说,义素少的有两个,多的有五六个,再多的有十来个。从变量义素中找出常量,这是学习词典编写者的责任。义素在学习词典里有3个量:超量,足量,非足量。超量,就是给出的义素过多;只有释文中必要的语义特征,那才是足量;没有满足释义必要的语义特征,那就是非足量;义素变量中的常量,多数情况下只有3个左右语义特征。
足量,就是最显著的、最具有区别性的、最容易感知的语义特征。其中既有事物本身特征的显著性因素,也有人们认知时注意点的因素,更有义位自身的义素特征。学习词典编写者同时注意提取这3个因素,并同时赋予最佳的表述。
(3) 义项划分的精细性——吸收现代语义学成果
从19世纪20年代以来,洪堡特、密尔、索绪尔、萨丕尔、奥格登/理查兹、布龙菲尔德、吕叔湘、兹古斯塔、利奇、诺维科夫、莱昂斯等,对词义渐渐产生了二分观、三分观、四分观、七分观等。义位主要包含5个要素:第一是所指或外指意义(指物、指概念/观念等),第二是系统价值或内指意义(跟相关词的义差、用差等差别),第三是各种附属意义(理性的、感情、语体、语域、时空的等等),第四是语法意义(词性、结构、变化、功用等),第五是语用意义。这些现代语义理念,不仅先后演绎出《简明牛津词典》(1911)、《小拉鲁斯词典》(1948)、《俄语词典》(1949)、《现代汉语词典》(1960)、《小罗贝尔词典》(1972)等词典,而且被编码词典充分吸收并全面推进。
(4) 释义凸显词的用法——吸收语用学成果
20世纪从房德里耶斯到克鲁斯,有些人主张词义就是用法。乌尔曼仅仅称其为“操作定义”(operational definitions)。大哲学家维特根斯坦到后期对自己主张的“用法说”也产生了怀疑。现代语用学主流学者认为,用法不等于词义,仅仅是词义多要素之一,有的是词的语言义,有的是词的言语义。以此为中心,编码词典吸收了语用学的许多成果。诸如:适当增加词、语、小句等内词条,必须交代词语的语境义及义位变体,凸显词语及其意义常用项(舍弃罕用项),提示话语结构,礼貌用法等等。
(5) 例证的语用性,编码词典的新组合理念
组合,指的范围比搭配广,除了指词语搭配,还可以指语素之间、短语之间、句子之间及其内部语义的组合。解码词典给出的组合,多是短语;已有的编码词典给出的组合,多是句子。须要强调的是,编码词典不仅必须配以例句,而且必须给出例语。而例语又必须给出两类:常见的组合、特殊(习惯、受限)的组合。
组合理念的中心,主要考虑非离散语法所谓的语句的合格度和可接受度,此外还有常用性和完整性。而语境理念主要考虑自然完整语句的语境,即语句的语言语境和非语言语境。最佳语境给被释词的“待填空白”,只能是一值(即被释词),不能是二值或多值(即被释词以外的词)。
(6)编码词典的读者本位性
编码词典把读者对象置于前所未有的高度,置于前所未有的中心地位。例如,选词立目、释义配例,学习词典都是以读者的编码及解码需要为轴心,首先是频率原则,其次才是词汇、词义系统原则。
综合性、语文性词典向积极的、学习型词典靠拢,吸取其释义优点。《简明牛津》新版和《朗文当代英语词典》就是尽量吸收了学习词典的优点,因此获得了极大成功。
1.3.2.3 传统释义方法、新兴释义方法及其综合问题
从古至今释义方法有下列7种:A)同义对释,B)反义对释,C)素义对释,D)短语对释,E)个性义征+上义/类义义位,F)叙述/描写物征、义征,G)用自然语言完整句子表述义征。ABCD式,注重的是被释词和解释词的共性,惯用于解码词典,如《钱伯斯20世纪词典》许多地方用同义对释。而在编码词典及类似的词典中很少用或完全不用同义对释,如旧版《小罗贝尔》只占15.02%,《现代法语词典》占3.7%,《柯林斯英语词典》则完全取消了。EF式属于分解释义,注重的是被释词的个性,对于解码词典和编码词典都是适用的,但是使用的限度不同:一般适用于解码词典的主条,广泛用于编码词典的主条和副条,但是在副条中还必须注明副条语义、语用个性。G式一般不用于解码词典,而用于编码词典,如《BBC英语词典》《钱伯斯基础英语词典》《朗文3》《柯林斯》(占该词典释义总量的99%),但是不宜过多使用,因为用于自然语言完整句子中的词和被释词在许多情况下是不等值的,也就是语言系统的词位常常不等于“语段词”(言语语境中的词),个例遮蔽了类型,单一遮蔽了多样(多样信息、结构、搭配),基义遮蔽了陪义。总之,解码词典和编码词典的早中近期显示出的释义趋势是:从单一、分解、句子转至多式(ABCDEFG)综合。《麦克米伦英语学习词典》正向综合靠拢。
1.3.2.4 辞书元语言研究及其应用
元语言,一是指用来释义的自然语言的两三千常用词,叫“释义元语言”或“义元” (primitive);二是指代表义素的人工设计的语言,叫“形式语言”“符号语言”“语义标示语”等。
前一理念即“释义元语言”的研究,主要有两个问题:一是定量研究,选取多少个常用词?二是用少量的常用词如何表达复杂的释义内容?有时会出现,释文中的非常用词如何转化成常用词?强国在解决这两个问题基础上,演绎出了一系列词典,较早的有:1932年奥格登和理查兹《基础英语词典》(释义词850个),1935年威斯特《新方法英语词典》(释义词1779个,1961版1490个),1971年《法语宝库》(有限度地使用了元语言,见其《导言·释文的语言》),1978年的《朗文当代英语词典》(以后各版,释义词都是2000个多一点),1995年《柯林斯合作英语词典》(释义词2000个),2000年《牛津高阶英语学习词典》(释义词3000以内),2002年《麦克米伦高阶英语词典》(释义词2500个)。总之,用少量元语言,已经成为以学习词典为代表的词典释义主流趋势。据可靠信息,我们将在2015年出版一本用少量元语言释义的词典。未来的理想的汉语学习词典,应该用4000左右个常用词较为合适。在这方面,我们落后了80年。
1.3.2.5 语料库研究及其应用
语料库理念萌生于1959年伦敦大学语言学教授R.Quirk,几年间建起涵盖多种语体的上百万字的“英语用法语库”。1961年美国布朗大学建起第一个机读的逾百万字的“布朗语库”。从20世纪80年代起,柯林斯等出版社和伯明翰等大学合作,创建了“COBUILD语料库”“英国国家语料库”,由此开发了《柯林斯COBUILD英语词典》《牛津高级学习词典》《朗文当代英语词典》《钱伯斯基础英语词典》等。
用语料库比用人工卡片具有许多优越性:不仅省时、省力、省钱、省物、便捷,而且具有鲜活性和广阔性,它提供了广阔空间让编者选择自然语言完整典型例句。因此,这些编者都不要自造例句,迫不得已时也只能适当改动例句。
就规模而言,词典用的理想语料库,其字节数量跟词典条目数之比,较合适的量应为10000:1。例如,4亿字的平衡语料库,对于编一部收词4万条的辞书较为管用。就内涵而言,语料库必须含书籍和报刊,而且是多地域、多语域、多语体(以上三项至少包括10多个子项)、多作者(至少1000多)、多学科(70左右)的,一个或各个断代的。它们代表活语言的真实文本,由此产生的词典才能是活语言的缩印本。可惜,中国到目前既没有理想语料库,也没有一本来自语料库的真实文本词典。在这方面,我们比强国晚了近40年。
上述热点理论以1~5方面为代表的12个方面的研究,不是孤立的,它们受制于现代哲学、文化学、语言学、数理逻辑学、数学、计算机科学以及其他科学技术。因此,在这些方面要想赶超辞书强国,至少需要二三十年。