术语学与术语信息处理
上QQ阅读APP看书,第一时间看更新

第三节 术语学介绍

一 什么是术语学

术语学(Terminology)属于应用语言学的一个分支,是一门相对较新的学科。术语学是对上下文语境中的特定概念的标记或命名,在知识系统中进行系统化、规范化的研究分析,以记载、统一、维护这些概念的正确使用的一门科学。从研究范畴而言,术语学研究概念和表达概念的术语,以及术语的发展规律,包括各专业领域中术语的结构、发展、用法、管理,以及概念、概念定义、概念分类、概念命名、概念体系、术语演变、术语编纂、术语数据库的构建等内容。术语学研究最基本的对象为术语,具体来说包括术语的性质、形成、分类、系统和作用等理论及应用课题。随着术语数量的急剧增长,术语学所覆盖领域的广度将不断扩大,加强术语学研究以指导术语的实践活动已成为一项必要的工作。

术语学是研究范围极其广泛的一门边缘交叉学科,是一门理论与实践方法相结合的学科,并不断与多门学科相关联,涵盖学科范围广泛,几乎涉及人类知识的各个领域。尤其在当今社会,科技发展日新月异,新的领域不断出现,已有领域也不断向纵深发展,术语的跨学科性(Cross-disciplinarity)与超学科性(Trans-disciplinarity)特征越来越明显。与此相适应,术语学的研究范围涉及语言学、逻辑学、本体学、认知学、词典学、翻译学、文献学、分类学、情报学和信息科学,是一门文理融合的综合性学科。术语学的研究方法也吸收并融合了哲学、系统方法论、逻辑学、符号学、控制论、语言学等多学科的研究方法。

新术语的产生、发展、普及和旧术语的消亡都体现了某个学科领域的发展与演变。有术语学家甚至提出在当今社会,术语学发展程度已经成为衡量国家科学技术先进与否的重要标志之一。审定、统一和规范术语,加强术语学研究,对于科技进步、社会发展具有重要的意义。术语学作为一门独立的学科必将发挥越来越大的作用。

二 术语学的发展简介

早在古希腊和古罗马时代,各类人文科学、自然科学的概念都通过术语来表述,这是最早的术语相关知识的研究。18世纪的研究主要是针对哲学、自然科学、人文科学等领域内概念的术语表示。18世纪以后,对术语的研究主要是针对术语的命名和统一。19世纪各个学科的科学技术协会分别建立起来以进行术语的相关研究。20世纪30年代初期,奥地利的欧根·维斯特开创了术语学,作为一门真正的科学,术语学诞生了。20世纪70年代以来,术语学从传统的应用语言学中独立出来,成为了一门独立的学科。术语学作为一门新兴的学科产生之后,与自然科学和社会科学的各门学科的关系越来越密切,各领域的知识不断交融渗透。近年来,大量术语学的研究与计算机科学和自然语言处理技术相结合。术语学的本体研究也借助术语数据库与语言知识库和一些先进的研究手段,取得了丰硕的成果。在这些研究中,篇章术语学、术语知识工程学、认知术语学代表了术语研究的新方向。

三 术语学的主要流派

现代术语学有四个著名的学派:德国-奥地利学派、俄罗斯学派、捷克-斯洛伐克学派、加拿大-魁北克学派。

德国-奥地利学派的观点认为概念在术语学中占有重要的地位,概念是术语学的核心。他们认为首先要划分概念,才能划分概念的名称,即术语。术语是传递知识、技术和不同语种之间的概念的工具。概念系统是术语的基础。从语言学方面来讲,该学派术语学的研究一般只停留在词的研究层面上,处理术语的形态变化和句法规则与普通词汇无异。术语学的研究采用共时而非历时的方法。研究者认为术语学与语言学的研究方法是不同的。语言学的研究是描述性的,术语学的研究不仅具有描述性特征,同时还具有规范性的特征。他们也认为术语定义在术语学研究中占有特殊重要的地位,为了保证术语定义的一致性,需要建立起严格的下定义的规范准则。

捷克-斯洛伐克学派的观点认为,术语学是语言学的一个分支,所以术语学研究应采用语言学的研究方法。他们认为术语与普通词汇之间有着明显的区别,应明确两者之间的区别。术语的社会交际功能需要被重视,同时要加强术语特性的分析和研究。

俄罗斯学派的主要观点认为,术语学研究的对象属于语言范畴。术语学是研究、解决与术语相关的各种实际问题的一门应用科学,同时术语学的研究与社会文化有着密切的关系。

加拿大-魁北克学派同样认为概念是术语的核心内容。概念是术语分类、命名及给术语下定义的基础。术语在本质上是由概念、描述概念的指称构成的语言符号。术语标准化是社会语言学的研究范畴。术语工作同社会的语言政策有着不可分割的关系。他们认为在术语研究中,新术语具有极其重要的地位。

四 我国的术语学研究

(一)我国古代、近代的术语学研究

中国古代的科技水平在世界范围内处于较高的水平,伴随着科技的发展产生了各类学科的术语。席泽宗认为:“中国有着悠久的历史,历朝历代都很重视定名,孔子说过‘名不正,则言不顺;言不顺,则事不成。’这说明名词是一切事物发展的起源。我们的老祖宗很重视名词,也付出了很多心血和努力。”

2300年前,中国古代思想家墨子编著的《墨经》中包含了大量的关于古代科技的术语,涉及力学、光学、几何学、工程技术、物理学、数学等领域的基本要素。《墨经》中术语的定名与术语的定义书写都具有高度的逻辑性与规范性。战国末期荀子的《正名篇》是一部有关语言理论的著作,书中涉及的很多语言观点都与术语有关。中国最早的古代术语词典是汉初的《尔雅》,被称为“中国辞书之祖”。“尔雅”的意思是接近、符合雅言,即以雅正之言解释词语,使之近于规范。全书共有19篇,有16篇均为解释名物词,共1400多条,涉及了各类学科的术语,其中大多数术语是科学技术术语,同时该书给这些术语都下了定义。魏、晋、南北朝时期,东晋葛洪的《抱朴子·仙药篇》、南北朝祖冲之的《缀术》、北魏郦道元的《水经注》等著作中都创造了大量的科学术语。汉、唐时期的佛典翻译,吸收了很多梵文的佛教术语。北宋沈括的《梦溪笔谈》一书中创造了许多数学、物理学、地理学术语。明代徐光启的《农政全书》创造了许多农业、土壤和水利工程方面的术语。宋应星的《天工开物》被西方学者称为中国科学技术的百科全书,19世纪被翻译成多种语言,书中收集了大量的科技术语。李时珍的《本草纲目》描述数百种植物和矿物岩石名称,并且首次采用了系统科学的命名及分类方法。明末清初出现了大量的翻译著作,介绍西方的科学技术,涉及领域十分广泛,在这些译作中出现了大量的术语。19世纪后半期,大量有关科学技术的国外著作被译为中文,译文中创造出了大量的新术语,丰富了术语的集合。1909年,成立了科学名词编订馆,这是中国第一个审定科学技术术语的统一机构。20世纪初完成了《辞源》、《辞海》的编写,这两部著作中收录了大量的术语,并对术语下了定义。

(二)近年国内的术语研究

我国近期的术语学研究从20世纪80年代开始。我国在1978年加入国际标准化组织(ISO)。中国标准化研究院(CNIS)、全国科学技术名词审定委员会(CNCTST)、东亚术语论坛(EAF-Term)等术语学术机构也加入了国际术语信息中心(International Information Center for Terminology),中国的术语学研究已日益与国际术语学研究接轨。1985年国务院批准成立了全国科学技术名词审定委员会,专门开展科技名词的审定工作,这是我国科技术语的规范进入历史新时期的标志。

术语数据库是进行术语研究的工具,是专业领域知识研究的重要知识源,可为专业领域及其他领域的研究人员和使用者提供系统化、结构化的领域信息。术语数据库的研究和开发直接影响到术语研究的水平。我国的术语数据库研究从20世纪80年代初开始。从1989年开始许多科研与教学单位陆续建立了各种类型的术语数据库。近年来,我国已经成功研发了一些领域专有的术语数据库,如机械、农业、化工、应用语言学、科技、大百科等术语数据库。数据库的收词规模小到数万,大到数十万。在术语与数据库规范的政策指导方面,一系列的国家标准相继颁布,如《确立术语的一般原则与方法》《建立术语数据库的一般原则与方法》《标准化工作导则——术语标准编写规定》《辞书编纂符号》《术语学基本词汇》《辞书编纂基本术语——第一部分》《术语与辞书条目的记录交换用磁带格式》《术语数据库开发文件编制指南》《术语数据库开发指南》《术语数据库技术评价指南》等。

1985年全国科学技术名词审定委员会经国务院批准成立,工作领域涵盖基础科学、工程与技术科学、社会科学、医学、农业科学及交叉学科等各个领域,建立了较为完整的科学技术名词体系,促进了相关学科的建设和发展,推动了国内外科技知识的交流与传播,特别是对现代信息技术的应用与普及,起到了支撑性的作用。

在学术期刊方面,创建了专门定位术语研究的学术期刊《中国科技术语》。该期刊致力于建设中国特色的术语学理论、促进全球华语圈科技术语的统一与规范;是由科技专家与语言专家合力打造的集科技与人文于一体的综合性刊物。主要介绍国内外术语理论研究成果,公布规范科技名词,发布试用科技新词,组织重点、难点科技名词的定名讨论,探究科技术语的历史文化内涵,报道科技名词规范工作动态,促进术语学在中国的发展,是及时发布规范汉语科技名词的媒体,也是集中展现我国科技名词术语审定工作情况的窗口。

1993年我国成立了中国术语工作网,致力于提供术语资料与咨询服务,组织术语学方面书籍的编纂与出版,研发计算机辅助术语工作,开展术语学的教学与培训,推动国内外术语工作的合作与交流等方面。

术语研究也是当代语言学关注的热点问题。从20世纪90年代以来,认知术语学逐渐兴起。研究者从认知心理学、认知语言学的角度探讨术语学的问题。2004年全国科技名词审定委员会与黑龙江大学联合成立了中国第一个术语学研究所。2009年国家学科标准设立了独立的术语学学科代码。近年来,术语学借助计算机科学的技术和方法不断扩张和丰富研究领域的广度和深度。2013年两岸科技名词交流对照统一工作取得重大进展。我国第一部全面介绍汉语术语学理论的《中国术语学概论》编著完成,首批科技新词即将发布试用。

中国的术语学已经初步形成了具有一定高度、符合术语学内部规律的学科体系。术语学的研究和发展水平、标准化水平、术语数据库的开发水平已经接近世界领先水平。中国的术语学研究正朝着国际化、网络化、信息化的方向发展。

五 术语数据库

(一)术语数据库简介

储存在计算机中的记录概念和术语的自动化电子词典,叫作术语数据库(Term Database)。术语数据库是由术语及其相关属性构成的数据库,是专业领域内的机器词典(Machine Dictionary)。利用术语数据库可以快速、准确地查询到术语的各种属性信息,也可实时更新、扩容数据库信息。术语数据库是术语学研究的重要工具,很多术语学的本体研究及与术语学相关的语言学、信息学的研究都是在基于术语数据库的基础上完成的。冯志伟(1989)认为术语数据库的研究是计算语言学的一个实用部门,它是现代语言学、现代术语学和现代计算机技术相结合的产物。

术语数据库的研发是术语学与术语标准化研究的重要内容。世界上第一个术语数据库DICAUTOM,是由J.A.Bachrach 1963年在卢森堡建立的。之后德国、瑞典、加拿大、法国、苏联也分别建立了术语数据库。世界上著名的术语数据库包括: BTQ、BTC、LEXIS、TEAM、EURODICAUTOM、NORMATERM、TERMDOK、TERMNOQ、TERMIUM、GLOT、DANTERM、ASITO等。

我国最早的术语数据库是在1989年由机械科技信息研究院建立的机电工程术语数据库。在此之后农业叙词表数据库、化工术语数据库、英汉科技分类词库、中国大百科全书术语数据库、应用语言学术语库、计算语言学数据库、测绘术语数据库、科学技术术语数据库等不同领域的专门术语数据库应运而生。特别值得一提的是,2000年原中国标准研究中心的研究人员研制成功了中国标准术语数据库,该数据库中每条术语包含中文定义、汉语拼音、中文同义词及各种附属信息,同时可查询到该术语的英文对应语、英文同义词等信息。该数据库为调节科技、社会等各领域中的术语使用提供了范本,为形成中国良好的语文环境做出了基础性的工作。

(二)术语数据库的分类

术语数据库可根据不同的应用目的和面向对象分为不同的类型,一般按数据库的应用目的可分为两类。第一类用于术语标准化与术语协调、统一工作的术语数据库。该类数据库中每个术语条目都包含结构规范、内容准确的术语定义。第二类用于知识体系构建的术语数据库。该类数据库中每个术语项都有表示概念的属性。这些概念属性之间互相关联,同时概念与概念之间,依据某种结构关系或语义关系互相关联,形成结构化、规范化的概念网络,概念网络构成知识体系。

术语数据库按数据库面向用户群大体可分为三类。第一类是为翻译工作者建立的术语数据库。该类数据库服务于中外文翻译工作,数据库包含双语或多语的术语对照表及术语定义的对照表。双语或多语术语库对翻译过程本身具有较高的参考价值。一般来说,翻译工作者不是领域或术语学专家,要求普通的翻译者对各个领域的术语有全面、准确的了解是不现实的。翻译者借助该类数据库,可快速查询领域专有词汇的外语对译词,确保翻译用词的准确度,也减少了人工查询、检索、对比、筛选的工作,避免了术语的混用、错用现象,提高了翻译质量与翻译效率。特别是外文的科技文献、商务文书对术语翻译的准确度有着更高的要求,规范化的术语数据库对翻译工作起到了很大的支撑作用。跨语言对照术语数据库也促进了跨语言术语的统一与规范,有利于术语在全世界范围内的普及与推广。第二类是为领域专家建立的术语数据库。该类数据库可为领域专家把关领域术语及术语定义的创造、使用、推广。术语数据库可以根据需要进行再编辑与扩容,便于领域专家全方位地研究与分析术语相关技术的发展、变化。第三类是为一般公众建立的术语数据库。该类数据库为非专业的普通使用者提供一种快速、便捷的查询术语信息的工具。相对其他术语信息源,该类术语数据库信息权威、客观、全面、准确度高、可靠性强,在使用者中的认可度最高。

规范化的术语数据库的目标是为使用者提供正确使用术语的标准,因此应具有内容完备的属性来描述术语的各个方面的概念特征,同时根据不同的应用领域需求,数据库还可以包含其他不同的属性,来描述术语的领域特异性。一般来说,常见的术语数据库中最基本的术语信息应包括术语词条、术语定义、读音、对应的外文(通常为英文),其中术语词条与术语定义是术语数据库中最重要的内容。有的数据类目较为完备的数据库还包含术语的左右词汇搭配信息、词类信息、频率信息、同义词信息、反义词信息、领域相关词信息、术语的产生时间、出处信息等。有的数据库还包括术语与其他术语之间关系的关联信息,如同义、近义、上下、整体-部分信息、术语在概念体系中的位置信息、领域分类信息和一些语义信息。

我们知道,术语的数量是极其庞大的,并且术语集合是一个开放集。每年都会有大量的新术语不断地涌现,每个术语词条下又有各式各样的数据类目。高效的术语数据库可以快速、便捷地存储、读取各项数据类目。研究者还可以借助自然语言处理的知识和计算机的计算功能,在研究术语数据库中基本的术语信息以外,研究术语内部更深层次的语义关系。高质量的术语数据库还应易于扩充和编辑以满足不断增加的术语集的要求,同时易于查询和检索以满足数据库用户的检索、使用要求。如何创建、保存、使用和管理术语数据库始终是摆在术语学家、语言学家、领域专家面前的重要问题。

六 术语概念的唯一性与术语定义的多样性

术语概念的唯一性与术语定义的多样性是两个并不矛盾的事件。我们知道,术语与概念之间必须保持一一对应的关系,即一个术语在一个领域中只能指称一个概念,一个概念也只能对应于一个术语;同时本研究认为,术语与术语定义之间可以保持一对多的关系,即一个术语可以有多个语言形式的术语定义,这些不同内容的术语定义用来有侧重地描述术语的不同属性特征。术语的定名与如何给术语下定义有着各自不同的规范准则。

(一)术语定名的要求

所谓术语定名,就是给一个概念指定一个科学的术语的过程。术语学的理论认为,术语的定名必须符合以下特征。

1.准确性(Accuracy):术语要确切地反映概念的本质特征。

2.单义性(Monosemy):至少在一个学科领域内,一个术语只表述一个概念,同一个概念只用同一个术语来表达,没有歧义。在创立新术语之前首先需检查该术语是否有其他同义词,若有同义词需在这些同义词中作出最佳选择。

3.系统性(Systemization):在一个特定领域中的各个术语,必须处于一个明确的层级结构之中,共同构成一个系统。

4.语言的正确性(Linguistic Accuracy):术语是词汇集合的一个组成部分,因此术语的结构要符合该语种的构词规则和词组构成规则。

5.简明性(Conciseness):为提高使用效率,术语要简明扼要、易读易记。

6.理据性(Motivation):术语的学术含义不应违反术语的结构所表现出来的理据,即可顾名思义、望文生义。

7.稳定性(Stability):术语一经定名,尤其是那些使用频率较高、使用范围广泛的,除非特别必要,一般不宜轻易改动。

8.能产性(Productivity):又称作派生性。术语确定之后,还可以由旧术语出发,通过构词法或词组构成的规则方法,派生出新的术语。基础术语越简短,构词能力越强,其派生为新术语的能力也就越强。

(二)术语的潜在歧义论

歧义(Ambiguity)是自然语言中的普遍现象,任何一种自然语言都存在歧义现象,这也是自然语言与人工语言的区别之一。当语言形式与语言内容不能一一对应时,歧义便产生了。同形歧义现象增加了自然语言的自动剖析(Automatic Parsing)的复杂度。术语作为汉语词汇的一个组成部分,同样也具有歧义现象。

术语的潜在歧义论(Potential Ambiguity Theory),简称为PA论,是由冯志伟先生提出来的,是现代术语学的重要理论创新。PA论认为,中文词组型科技术语中,当一个词组类型结构(PT-结构)对应于一个以上的句法功能结构(SF-结构)时,就有可能对这个词组类型结构作出一种以上的不同解释,这时该结构是潜在歧义结构。所谓潜在,指的是PT-结构在实例化过程中,歧义有可能保留,成为真歧义结构,也有可能消解,成为歧义消除结构,所以这种歧义形式是潜在的。PA理论完善了传统语言学中“类别-类例”(Type-Token)理论对歧义的理论认识。“类别-类例”理论认为歧义格式相当于类型,实例化之后的词组相当于类例。事实上,类型原有的歧义并不会总在类例中出现,在一定条件下,类例转化为不具有歧义的结构。

潜在歧义论对国际术语学术界产生了重要的影响。冯志伟描述了汉语中的26种结构歧义,并以计算机科学领域中的术语为例,阐述了汉语术语中的11种潜在歧义结构,主要包括述宾-定中歧义、主谓-状中歧义、定中-状中歧义、述宾-状中歧义、主谓-定中歧义、联谓-状中歧义、联体-定中歧义、主谓-定中-状中歧义、述宾-定中-状中歧义、联谓-状中-述宾-述补歧义、联谓-联体-述宾-定中-状中-主谓歧义。

(三)术语标准化的必要性

术语的特征之一是单义性,即一个概念对应一个命名。术语的单义性特征确保了术语不会因为概念的不确定性而造成使用者理解上的偏差,保证了术语所描述的信息被正确无误地传达。

下文我们以几个例子来说明术语名称的混乱给人们日常生活带来的严重后果。《北京晚报》2005年9月7日在一篇题目为“阿奇霉素竟有药名11个”的文章中指出,阿齐霉素有11个名称,如“泰力特”“齐诺”“希舒美”等。更惊人的是,据《首都医药》最近的一项调查表明,同一个药物最多竟然有60个名字,药品名称的混乱使用已严重影响到用药的安全。目前在我国市场上流通的药物有6400多种,其中常用的药物有2000多种,而与之相对应的药物名多达万种。例如,“左氧氟沙星”有64个商品名,还有40种常用药,各自的商品名都超过20个。据统计,每年有1/4的住院病人存在不合理用药,原因之一就是因为“一药多名”现象引起的混乱用药。

2006年5月1日中国教育和科研计算机网刊登了一篇题为“我国科技名词的规范和统一任重而道远”的文章,也谈到了术语名滥用的问题。文中举例说“ergonomics一词,在15家出版社出版的21部词典中,分别有人机学、人机工效学、人类工程学、人体工程学、生物工艺学、人类环境改造学、劳动经济学、工作环境改造学、工效学等22种叫法。如此混乱,如何交流?”

2014年8月15日新浪首页刊登了一篇报道,引起了上万网友的热议。湖南省纪委预防腐败室一名副主任实名举报国家食品药品监管总局职责相关部门把中国南方地区传承上千年的“金银花”更名为“山银花”,并表示这一行为给数以千万计的百姓造成无比重大的经济损失。由于“金银花”一字之变毁掉一个产业,使其价格由12元跌至1.4元。邵阳市金银花花农拉横幅游行,要求中纪委查《药典》改变内幕,该事件在社会上引起了强烈的反响。

近年来在对外贸易、文化交流等领域,由于术语的定名不统一、规范性较差造成的交流失败或者经济损失屡有发生。保证术语与概念的一一对应性,是与日常生活息息相关的现实问题,是术语标准化工作的重要内容。

1.什么是术语标准化

《GB/T 20000.1-2002》中给出的术语标准化(Term Standardization)的定义为:术语标准化是为了在一定范围内获得最佳秩序,对现实问题或潜在问题制定共同使用和重复使用的条款的活动。具体来说,术语标准化是在具体或抽象的事物完成其功能的过程中,用人为的方法,消除其所不必要的个别属性,使这些事物符合某种标准,从而保证它们能够相互交换而不受时间和地点的限制的一种全社会的活动。标准化工作应遵循简化性、协力性、实践性、选择性、复审性、方法性、强制性等原则。

造成术语的不规范现象的原因主要有以下几种。

跨学科领域的术语借用;跨语境的术语借用;地域之间的差异造成术语使用混乱;媒体的传播误导。

术语标准化工作包括对本民族本土术语及外来引进术语进行规范的工作,包括对术语的定名、下定义、规范与协调。定名就是给一个概念赋予一个恰当的名字,将指称与概念一一对应起来,并给予该指称一个正确的定义。规范与协调是指将有可能混乱不一致的指称进行统一规范。李宇明认为术语的规范有三个基本任务,即系统梳理、规范歧义术语与术语关联。其中术语规范的首要任务是从宏观上对术语按照学科的概念体系进行梳理。术语规范的重点和难点是对同名异实的多义术语、同实异名的同义术语进行规范。术语关联指的是通过各种关联手段建立起术语之间的联系,其中包括不同学科相关术语的关联,术语与俗名、不同地区术语名称、相关语种之间的关联,建立术语正条与已经规范不用的术语之间的关联。

2.术语标准化的重要性

由于概念产生与发展的速度不断增快,新术语的形成周期越来越短。据统计,每年新增术语大约十万条之多。对这个庞大的新术语集合若不加规范与统一,如果概念与术语之间缺少一一对应的关系,那么不仅无法达到正确理解与传播术语的目的,还会给领域学科的发展及现实生活造成混乱。术语标准化已经渗透社会生活的方方面面。2003年全球消费者顾问委员会发布的调查报告指出,消费者推迟购买新产品的一大原因是因为不了解产品及相关技术行业的语言。

术语标准化有助于分清术语之间的专业界限和概念层次,能正确指导各项标准的制定和修订工作,对科技的可持续发展与技术交流具有重要意义。术语的规范、统一也是进行文化沟通与学术交流的基础。国际标准化组织和国际电工委员会设有独立的术语委员会,负责术语标准化的相关组织、协调工作。很多国家也都设立了全国性的术语委员会来指导术语工作。

国际标准化组织第37技术委员会(ISO/TC37)负责根据术语学的基本原则制定相关的国际标准。中国标准化研究院是ISO/TC37的小组成员,多年来致力于国家标准及国际标准的建立。在经济全球化高速发展的今天,术语标准化的重要性越来越不容忽视。

七 术语与普通词语

(一)术语与普通词语之间的区别

术语是词汇集合的一个组成部分。术语与普通词汇之间究竟有什么异同?术语与普通词语之间的关系一直是术语学研究中的重要问题之一。

张普(2001)根据词语的流通度来区分术语与普通词语之间的区别。他对术语的界定如下:术语只在一个或几个领域内流通,是该领域的高流通度词语,并且在其他领域的流通度为零或者近似于零。流通度成为术语与一般词语相比较的重要区别特征。他认为,“术语和一般词汇都是整个语言词汇的组成部分,都必须符合语言的一般构词和构成规则。一般词汇是所有人都通用的词,专门领域的术语是该领域的专业人员使用的词或固定词组。一些专业领域的部分术语有时会进入通用领域被一般人使用,一些专门领域可能极少有术语进入流通领域被一般人使用,一些术语可能被两个以上的专门领域的人员使用。”

冯志伟(2000)认为,“术语是语言词汇的一部分,因为其学术性、专业性较强,它们并不属于全民共同语的基本词汇。”

刘建华(2008)认为,“术语与指定概念间有单一意义关系(单一性),在文中表达概念时,形式和内容兼具稳固性。对特定领域而言,术语较其他一般词具有频繁使用、相对固定的上下文环境(即共现)、特定排版(如斜体)等特点”。

格里尼奥夫(2011)认为,“术语首先属于词汇单元的大集合,其专业词汇的属性是第二性的。术语与非术语的关系比较复杂。从符号学的角度来看,在一般词汇的语言符号方面,是从能指到所指视角运动的,而在术语符号方面,则是从所指(概念内容)到所指(外部形式)的。”

在本研究中,我们认为,术语或普通词语并非一成不变的,在不同语境下,两者可能互相转换角色。

(二)术语的增长

科技领域、人文领域的新理论、新方法、新工艺、新材料、新仪器等产生了大量新概念。术语作为一个特殊的词汇集合,承载了专业学科领域知识系统的核心概念,是科技、文化沟通的重要工具之一。随着科技的进步与普及,很多专业术语不断融入普通词汇集合。统计表明,汉语新生词汇中有70%来自各学科领域的专门术语。1978年出版的《现代汉语词典》中,收录的术语为7657条,占收词总数56056条的13.7%。1987年出版的《汉语新词词典》收录的术语933条,占收词总数1654条的56.4%。《现代汉语新词语语料库》收录术语14466条,约占收词总数36291条的39.9%。这些新词语中术语所占比例是非常大的,英国语言学家G.Leech把这种现象叫作“行话化”。根据张会森先生的估计,“术语在当今的某些语言词汇中,可能占到80%左右”。李宇明认为,“新事物、新观念的产生或引进,必须创造新词语,包括给老词语添加新意义,或是改变已有词语的形式。新生词语层出不穷,用雨后春笋来形容新生词汇的产生速度之快、数量之多,毫不过分”。从上述的统计数据与观点可以看出,术语的增长速度呈不断上升的趋势,术语在词汇中所占的比重越来越大,地位越来越重要。

(三)术语与普通词语之间的交融、渗透

事实上,术语与普通词语并不是两个静止的概念,两者之间互相交融、渗透的过程始终没有停止过。在特定语境下,普通词语可以抽象为术语,术语也可以泛化为普通词语。

1.术语的泛化

术语的泛化(Term Generalization)是指专业领域的术语在通用领域被广泛使用,成为日常用语一部分的过程。术语的泛化改变了术语的单义性和专业性的特征。术语泛化为普通词语这一语言现象,一直以来都受到术语学家和语言学家的重视。

本书前面已经提过单义性是指在一个特定专业领域内,一个术语只表述一个概念,同一个概念只用同一个术语来指称,术语与概念之间是一一对应的关系。所以在术语命名中,应避免同义术语、同音术语和多义术语的使用,避免概念之间的混淆。术语的泛化与术语定名中要求的单义性原则并不矛盾。术语泛化的过程使得术语包含有一个以上的概念,但是由于这些概念分别属于不同的专业领域,所以并不会造成理解上的混淆。例如:

软件是指一系列按照特定顺序组织的计算机数据和指令的集合,一般来讲软件被划分为系统软件、应用软件和介于这两者之间的中间件。

在计算机领域内,“软件”的概念如上述定义所表述的,而在非专业性的通用领域中“软件”指“服务水平、管理模式、人员素质,企业氛围等内容”。

克隆指一种人工诱导的无性繁殖方式或者是植物的无性繁殖方式。

在生物领域内,“克隆”的概念如上述定义所表述的,而在通用领域中,“克隆”指复制与原件完全一样的副本的过程。

有些专业领域中的术语与通用领域词汇之间的界限逐渐模糊,两者之间由于共享某种属性特征,通过术语的泛化过程,术语成为人们的常用语、惯用语。例如下述两个句子中的“内存”和“盲点”:

对不起,这个问题我一下子忘记了,大脑内存不够用了。

这件事情你没弄明白,是你理解上的盲点吧。

经过泛化后的术语,失去了在专业领域中的单义性与领域性,进入通用领域内,并具有了多义性与普遍性。

2.普通词语的专业化

与术语的泛化相对应的是普通词语的专业化现象。普通词语的专业化(Word Specialization)指的是某些普通词语在特定领域与语境下,可以专业化为术语。词语在经过专业化过程之后,在不同的上下文环境、不同领域中,这些词语的概念内涵也不尽相同,甚至有时候可能完全不同,即普通词语专业化为术语后,概念上可能保持一致,也有可能所指称的是完全不同甚至毫无关联的概念项。下文我们将对普通词语专业化的几种类型分别加以描述。

普通词语可以成为具有相同概念的术语。我们以三个词语为例加以阐述,例如:

(1)“失眠”一词在《现代汉语词典》中的意思是“夜间睡不着或醒后不能再入睡”。该义项可作为通用领域“失眠”的普通词汇释义。

《医学科技词典》里的意思是“由于精神活动长期过度紧张,致使大脑的兴奋和抑制功能失调,精神活动能力因而受到影响而造成的不充分的睡眠或不完全的睡眠,临床特点是失眠、多梦,常伴有头痛、头昏、胸闷、心悸、腹胀、注意力不集中,临床表现有入睡困难、多梦、易醒、醒后难以再入睡”。该义项可作为医学领域“失眠”的术语定义。

(2)“增长”一词在《现代汉语词典》中的意思是“增加、提高”。

经济学领域的“增长”指的是:“连续发生的经济事实的变动,其意义就是每一单位时间的增多能够被经济体系所吸收而不会受到干扰。”

(3)还有一些普通词汇,可转化为领域专有词,并且可跨多个专业领域,分别指称同一个概念,但由于这些术语所归属的领域不同,定义描述的着眼点、侧重点不同,所以可以使用不同的定义形式对概念加以描述。普通词汇的义项与各专业领域术语的定义,在语义上有一定的交叉项,但却有着明显的区别,术语定义的领域特征性较为明显。以“房地产”一词为例,在通用领域中指“个人或团体保有所有权的房屋及地基”。

在房地产领域中“房地产”指的是“房产和地产的总称,房产指的是建立在土地上的各种房屋,包括住宅、厂房、仓库和商业、服务、文化、教育、卫生、体育以及办公用房;地产是指土地及其上下一定的空间,包括地下的各种基础设施、地面道路等”。

在法律领域中“房地产”的定义为,“房地产本质上是一种财产权利,这种财产权利是寓含于该实体中的各种经济利益以及由此而形成的各种权利,包括所有权、使用权、抵押权、典当权、租赁权等”。

从上述的词语释义与定义描述可以看出,普通人对“失眠”、“增长”、“房地产”一词的理解与专科大夫、经济学研究者、房地产从业者、法律从业者的理解在广度、深度层面都有很大的差距。

可见日常生活通用领域中的普通词语,可以专业化为某个特定领域的术语,但因对概念属性描述颗粒度的不同,而拥有不同的定义。

普通词语专业化为领域术语,且包含与在通用领域中截然不同的概念。例如,“指针”、“协议”、“地址”、“循环”四个词语,一般来说被认为是通用领域的普通词语,但在计算机领域它们的确是常用的专门术语。在《现代汉语词典》中的义项就是它们作为普通词语的释义,而在计算机词典或数据库中的义项就是它们作为术语的定义。

《现代汉语词典》中的释义如下:

指针:(义项1)钟表的面上指示时间的针,分为时针、分针、秒针,或仪表指示度数的针。

(义项2)比喻辨别正确方向的依据。

协议:(义项1)协商。

(义项2)国家、政党或团体间经过谈判、协商后取得的一致意见。

地址:人、团体居住或通信的地点。

循环:比喻周而复始。

上述词语在计算机词典中的释义分别如下:

指针:是一个保存对象地址的变量。

协议:一种成文的公约集,管辖两台相互通信的系统间的信息交换格式化和相对定时。

地址:(义项1)数据源出地和目的地的代码。

(义项2)确定传输目的地和来源的数字位或字符序列。

(义项3)文件的位置,可以使用地址查找Internet和计算机中的文件,Internet地址也称为URL。

循环:是一种常见的控制流程,是一段在程序中只出现一次,但可能会连续运行多次的代码。

普通词语演化为具有领域属性的术语的过程,通常是因为术语借用了普通词语的某些属性特征,而这种属性特征也是该术语的重要属性之一。例如,“孵化器指人工孵化禽蛋的专门设备”。“孵化”包含从无到有、从小到大的属性,被引入经济领域后,便可生动地表述为“在企业创建初期阶段,提供资金、管理等便利,推动合作和交流,使企业不断成长的过程”。

通用领域的词语转化为具有领域特性的术语的现象也是隐喻(Metaphor)在术语产生过程中特有的表现形式。所谓隐喻,是指由于两个事物存在某一类相似的特征属性,而用一个事物来指代另一个相似事物的修辞方式。隐喻是语言学中的普遍现象,术语是语言词汇的组成部分,所以隐喻现象同样会发生在术语中。

八 术语的跨语言借用

(一)术语跨语言借用的基本类型

根据《GB术语工作计算机应用数据类目》的定义,跨语言借用(Cross Language Borrowing)又称为跨语言移植(Cross Language Transplantation),是指一种语言直接使用另一种语言的某个术语。语言本身具有民族性与地域性,语言的借用现象是词汇发展的一种普遍现象。术语从不同的语言系统中借用词语或吸收词语的现象使得在术语集中包含一部分从别的语言借用过来的外来语。

术语中的外来语分为以下几个类型,其中以意译型与首字母缩合型数量居多。术语的跨语言借用体现了汉语对外来术语的吸纳和归化能力。

1.音译型术语(Transliterated Term)

音译型术语指的是使用本族语中相同或相近的语音,将外来语(主要是英语)的语音译写出来的术语(见表1-1)。

表1-1 音译型术语示例

img

音译法简便、直接,能直观地反映出术语的外来语语言身份。例如很多计量单位都使用音译法。在音译型术语中,语音承载的内容是术语借用的唯一理据,但这些外来术语的发音完全是按照汉语拼音的拼读规则来拼写的,所以不可能和源语言保持完全的一致性。

2.意译型术语(Paraphrased Term)

意译型术语是指按照原语言的意义翻译成汉语的术语(见表1-2)。

表1-2 意译型术语示例

img

汉语术语语言系统的结构基础是由语素组成的,这一特性决定了在术语借用的所有类型中,意译法占优先地位。意译法保证了原语言与目标语两种语系之间所表达概念的完全对应,是最易于理解的术语借用类型,也是最优选的借用类型。

3.首字母缩合词术语(Initial Term)

首字母缩合词术语是指根据外来语的每个单词的首字母而组成的术语(见表1-3)。

表1-3 首字母缩合词术语示例

img

续表

img

需要注意的是,首字母缩合词术语在不同领域也可能出现同名异义现象。例如,术语“SLR”在不同的领域表达不同的内涵,具有不同的术语含义。

在摄像领域SLR(Single Lens Reflex)意为单反相机。

在海洋学领域SLR(Sea Level Rise)意为海平面上升。

在信息学领域SLR(Super Logic Range)意为超级逻辑区域。

首字母缩合词并非全部都为术语,其中也包含普通词语。例如,下述首字母缩合词“APR”所代表的概念包含:

APR(augmented pay reality)增强支付现实

APR(Apache portable run-time libraries)Apache可移植运行库

APR(annual percentage rate)年利率

APR(annual products review)年度产品回顾

APR(April)4月

其中APR(April)为普通词语,其他各项为专业领域术语。

在实验中,我们发现首字母缩合词术语同名异义的现象,在所有术语类型中最为普遍。以术语CPI为例共有17个不同义项,分别覆盖经济、政治、信息、管理、医学等领域,其中消费者物价指数(Consumer Price Index)在这17个义项中知晓度、使用频次最高,其余义项知晓度普遍较低,使用频次也较低。

(二)术语本土化过程中的命名问题

术语本土化(Term Localization)是指在术语跨语言借用过程中,将外来术语的语言形式改变为本土语言的形式。李宇明认为,术语本土化过程中的术语命名问题涉及本土化、规范化与国际化的问题。近代西方在科技方面仍占有一定的优势,自洋务运动以来,中国术语工作的一个重要部分就是术语本土化。任何一个术语都不是孤立存在的词汇,而是术语庞大的体系网络中的一个节点,与其他术语有着各种语义关联。在术语本土化的翻译过程中需考虑本族语的语言特点及已经建立好的术语体系。

在术语借用的所有类型中,意译法难度最大,基本相当于在汉语词汇中创造了一个新词。译者需要对源语术语所表达的概念有准确的理解和把握,还需有完善的本土语的语言学知识,同时还需对术语所涉及的专业领域有一定的了解,才能从母语中创造或找到最准确的术语对译词成分,并将这些成分组配成新术语。

在音译术语中,汉字只作为记音符号,不具有实际的意义。汉字本身的词义、语义已经被消解,所以对本族人尤其是对外来语掌握水平较低的本族人,音译术语与概念内涵间没有任何语义关联,理解与记忆都比较困难。从术语规范化的角度而言,在处理音译型术语的过程中,记音符号的选择是一件严谨的工作,必须遵循术语规范化的标准。

首字母缩合词反映出术语定义原则中的简洁性特征,这种术语生成方式简化了原来复杂的语言形式,便于使用者记忆与书写,也有利于术语的普及与推广,但它的弊端也很明显。当同名首字母缩合词术语过多时,即使跨不同领域,依旧会造成使用者对其概念的混淆。当汉语借用西文首字母术语时,尤其当该术语存在大量同名异义术语时,给首字母术语加入中文对应词注释是必要的。术语命名时需要在经济原则与准确性原则方面找到最佳平衡点。

跨语言借用现象在术语的构成中占有相当大的比重,随着不同语系间术语移植现象的不断增多,该比重还有不断上升的趋势。术语的跨语言借用表明科学技术与社会发展在各个国家之间的交流与传播越来越广泛,也充分体现了全球一体化、科技无国界、文化无国界、信息无国界、术语无国界这一特点。

(三)汉语术语的输出

汉语术语的输出(Chinese Term Output)指的是将本族术语输出到其他国家语言系统中的过程。本土术语的输出是外来术语输入的逆过程。一个国家输出术语的数量与它在该领域的领先水平成正比。近年来,随着中国经济与科技的迅猛发展,术语输出的速度不断加快,体现了中国在科技、人文等各领域的国际影响力与相关学科的优势领先地位的不断加强。

汉语术语在中医、中药、武术、体操、传统风俗民俗等领域输出了大量术语,其影响广度与深度不容小觑。在某些科技领域,汉语输出的速度及汉语在国际术语库中的比例也在不断提高。李宇明认为,中国学者要培养起汉语输出的意识,在论文撰写与拥有自主知识产权的发明中,优先使用汉语语素构造术语,包括有意识地使用汉语拼音构造术语。扩大汉源术语的学术影响力,通过将汉语科技文献译为外文,加速汉源术语在世界范围内的传播。编纂汉源术语词典,集中反映汉源术语的全貌,也是术语输出的有效途径,同时在汉源术语的翻译过程中,应考虑外文的构词规则和语言习惯,以促进术语在非母语环境中的传播。

九 新术语与旧术语在定义出现概率上的区别

在术语定义抽取研究中,通过实验发现,新术语与旧术语在术语定义数量上的多寡有着明显的差异,该特征可用来作为辨别术语新旧的一个指标。在一个给定的文本集合中,对一个术语所包含术语定义数量的考察,对识别新术语提供了一定的支持。

(一)什么是新术语

据统计每年新增术语大约有十万个。究竟什么是新术语?新术语的概念有以下几种界定。

《GB术语工作-计算机应用-数据类目》给出的定义为:在标准化工作中或语言规划过程中处于刚刚引入阶段的术语。

《GB/T 15237.1-2000》给出的定义:对已有概念的重新定名和对新概念的命名。

王强军(2004)给出的定义:术语词典中未收录的术语,也叫未登录术语。

(二)新术语与旧术语的定义数量差别

判定一个术语到底是“新”还是“旧”,该问题的本身比较主观。不同文化、教育背景的人可能有不同的主观界定。那么是否有一种能被计算机操作的、实用性的方式可以界定新术语呢?“新”还是“旧”与术语定义数量的多寡是否存在一定的关联呢?我们选用两组术语进行实验对比。

一组术语知晓度较高、产生时间较长,另一组术语知晓度较低、产生时间较短。实验将两组术语都分别提交给搜索引擎,并对相同数量的返回文本中包含的术语定义的数目进行统计和对比。实验结果发现,新术语一组得到的术语定义的数量远远大于旧术语一组得到的术语定义的数量。换言之,新术语以定义形式出现的概率远远大于旧术语以定义形式出现的概率。由此我们可以得出这样的结论:新术语的出现往往伴随着定义的出现,一个术语作为新术语的概率与它的定义出现率成正比。

十 术语的语缀

现代汉语以合成词为主,缺乏严格的词型变化,派生词较少,语缀并不发达。随着新领域、新术语的产生,为了指称概念的某种属性特征,汉语术语的语缀也在不断增加。汉语中派生词的构词规则具有理解周遍性,只要词缀与其他实词素依据正确的构词规则组合在一起,使用者就可以根据语缀与实词素的语义类推出该类术语的语义。这种理解周遍性特征使得包含词缀的派生术语不断增多。术语的语缀与普通词汇的语缀不完全相同,前者只是后者的一个组成部分。汉语常用语缀如“阿”、“老”、“儿”、“员”、“第”等,以及近年来的网络流行语语缀如“族”、“迷你”、“热”、“控”等,一般不充当术语的语缀,不在本书的考察之列。表1-4和表1-5分别列举了最常见的包含后缀与前缀的术语示例。

表1-4 包含后缀的术语示例

img

续表

img

表1-5 包含前缀的术语示例

img

续表

img

这些包含语缀的派生术语,有相当大的比重是近年来媒体曝光率较高或与百姓生活密切相关的新术语,其使用范围广、使用频率高、影响力大、传播速度快。例如,“次贷危机”、“逆回购”、“市盈率”、“准现房”、“小产权”、“云计算”等。

十一 一些基本概念

下文分别介绍了与本研究相关的一些重要术语,这些术语的界定依据中华人民共和国国家标准《术语工作-原则与方法》。

1.概念(Concept)是客体在人们心理上的反映。术语的本质是表达概念的,术语学以研究术语所表达的概念及概念之间的关系为基础。概念是思维的最小单位,也是知识的基本单位。术语学所指的客体(Object),既包括客观存在并可观察到的事物,也包括依靠想象产生的事物。概念是人类思维的基本形式与重要组成部分。在认识事物的过程中,通过观察、分析、推理等思维方式,把客观事物的本质属性加以抽象概括从而形成概念。术语学所描述的概念是与某一个特定知识领域所研究的客体相对应的。在知识领域中,概念用定义描述,并被赋予约定的指称。

2.概念体系(Conceptual System)是通过逻辑关系联系起来的概念的集合。一组概念可根据概念间的相互关系构建成概念体系。每个概念在概念体系中占有明确的位置。概念体系间层级结构分明,能正确反映出客观事物,便于下定义和规范指称,便于协调和容纳不同语言的相应术语体系。概念体系反映相应的知识体系。概念体系的构建包括搜集专业领域的概念、分析概念的内涵与外延、确定各概念在概念体系中的位置及与其他概念的关系、为概念下定义、赋予概念科学的指称等工作。

3.特征(Feature)是指一个客体或一组客体特征的抽象结果,是用来描述概念的。任何一个客体都具有众多特征,人们根据一组客体所共有的特征形成某一概念。这些共同特征在心理上的反映,称为该概念的特征。

4.本质特征(Essential Feature)是指在某个专业领域中,反映客体根本特性的特征。本质特征因概念所属专业领域而异,反映不同专业领域的不同侧重点。

5.区别特征(Distinctive Feature)是指用以区分本概念和其他概念的特征,也称作变异特征。用定义描述被定义项时,必须给出区别特征。

6.层级关系(Hierarchical Relationship)描述概念间的包含关系。层级关系包括上位概念和下位概念。上位概念是指层级系统中,可划分为若干个下一级概念的概念。下一级概念则被称为下位概念。层级关系包括属种关系、整体-部分关系。属种关系是概念外延的包含关系,小概念的外延是大概念外延的一部分,小概念除了具有大概念的一切特征,还包含自身的区别特征。整体-部分关系指客体间的包含关系。小概念对应的客体是大概念对应客体的组成部分。

7.非层级关系(Non-Hierarchical Relationship)反映了客体间的除层级关系以外的其他关系,包括序列关系(如空间关系、时间关系、因果关系、源流关系、发展关系)、联想关系(如推理关系、形式-内容关系、函数关系、物体-属性关系、结构-功能关系、行为-动机关系、行为-客体关系、生产者、产品关系、工具-操作关系)等。

8.任何一个概念都包含内涵(Intention)和外延(Extension)。

(1)概念的内涵是反映到概念中来的事物的特有属性,即这个概念所反映的客体的全部特征。

例如,“木马是一种带有恶意性质的远程控制软件。”

(2)概念的外延是指一个概念所指客体的范围,是反映到概念中来的事物的数量范围。

例如,“木马一般分为客户端和服务器端两种类型,客户端就是本地使用的各种命令的控制台;服务器端则是要给他人运行,只有运行过服务器端的计算机才能够完全受控。”

按照外延的包含类型特征,又可分为同类外延和成分外延。一般来说,概念的内涵越丰富,包含的属性越多,外延则越小;反之,内涵越贫乏,包含的属性越少,外延则越大。该特征也被称作概念的内涵与外延的反变关系(Reverse Relation)。

9.术语学三角(Terminology Triangle)。在术语系统中,客体、概念、术语、定义四元素构成术语学的基础。术语学三角用图形表达了客体、概念、称谓(术语、名称或符号)、定义之间的关系(见图1-1)。

国际化标准化组织在《ISO/DIS704》中对术语学三角的四元素分别做了如下描述:

img

图1-1 术语学三角

(1)客体是主体以外的客观事物,是主体认识和实践的对象,是具体化的一个客观事物。被观察、认知或理解,被抽象或概念化成为概念。

(2)概念映现或对应于若干客体,由称谓或定义以语言形式表示,被组织成概念体系。

(3)称谓(术语、名称或符号)指称或对应某个概念,属于某个概念。我们用术语、名称或符号来表示这个概念。这些术语、名称或者符号就是称谓。

(4)定义用来界定或描述概念。在术语学三角的四个元素中,概念是基础。术语与术语学本身都是基于概念的。一个客体被观察、理解之后即抽象成概念。术语是概念的语言载体。在某个专业领域内术语与概念之间应保持一一对应的关系,即一个术语只表示一个概念;一个概念只有一个指称,即只由一个术语来表示,否则会出现异义、多义和同义现象。要了解一个概念必须有定义的支持,用定义来解释和描述一个概念,这个概念才可以被理解和传播。

术语学三角中概念—定义—术语三者的关系是术语研究的重要内容。