信息科技论文
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2章

国内外投稿中应注意的问题与规则

2.1 文化因素对科技论文写作的影响

2.1.1 科技论文与西方文化的渊源

每个科研工作者都希望发表能在国际上产生良好影响的论文。要做到这一点,除了要有一流的科研成果之外,论文的写作很重要。成果虽好,但首先要让国际同行看明白,才能得到认可。来自不同国家的国际同行有文化背景上的差异,这些差异会不会对论文的写作、阅读有影响呢?中国与西方文化的差异会不会影响我们的英文科技论文写作呢?在谈这个问题之前,我们先谈谈现代科技的起源和它的文化背景。

也许有人会说:老兄,我们只是在聊如何写论文哎,不要上纲上线,搞得那么复杂好不好?!其实,一个人只有清楚“自己从哪里来,要到哪里去”之后,才能把事情做好。所以,还是有必要再说几句。

我中华有灿烂之文明,但近现代科学技术却源于西方。中文的“科学”一词与英文的Science及拉丁文的Scientia对应,由康有为在1893年从日文中引入。当初引进此词的目的是介绍西方的科学思想。由此可见,近现代科技对中国来说是一个舶来品。

西方科技的渊源可追溯到古希腊文明。亚里士多德(Aristotle,公元前384—公元前322年)、欧几里得(Euclid,生卒年不详)、阿基米德(Archimedes,公元前387—公元前212年)是古希腊文明的代表人物,他们的研究为科学技术发展提供了重要的理论和方法。亚里士多德是一位伟大的哲学家,他创立了形式逻辑,同时在动物学、物理学、数学、天文学等方面也有突出贡献。他的逻辑分析为科学研究提供了重要工具。在研究方法上,亚里士多德特别关注“为什么”的问题。这对后世科学研究产生了重要影响。欧几里得是一位伟大的数学家,他创立了欧氏几何,被称为“几何之父”。欧氏几何对探究物理世界的贡献是难以估量的。据说爱因斯坦在研究相对论时,欧氏几何概念曾发挥了重要作用。阿基米德是一位伟大的数学家、物理学家、天文学家、工程师,他对力学做出了杰出贡献,用实验的方法发现并验证了浮力原理。这些希腊先贤的思想、方法、学说对后来科学技术的发展产生了深远影响。

当然,中国古代也有许多举世瞩目的科技成果,如四大发明、《黄帝内经》、《伤寒杂病论》《齐民要术》、《九章算术》、《本草纲目》等。同时,也有孔子、老子这样对世界文明产生重要影响的思想家,有《易经》这样的不朽哲学巨著。

总的来看,中国古代科技侧重实践经验的总结、自然现象的观测和描述,学问讲求实用;西方古代科技侧重实验,他们的科学研究(尤其是希腊的)仅是对知识的探索,并不追求成果实用。亚里士多德曾经公开宣称他的研究本身就是无用的,和他谈研究有没有用没有意义。在西方这种思想概念中,科学与技术并不相同。科学是纯粹的,可以是无用的,技术则是讲求实用。

但源于希腊的“无用之学”却最终发展为近现代科学。英国学者李约瑟(Joseph Needham,1900—1995年)曾经提出过这样的问题:为什么近现代科学没有起源于中国?对于这个问题,有专门的研究,我们在这里不做讨论。但结果确实是这样。

既然这样,在现代科学技术及与之相关的事物中,许多都有很深的西方文化烙印,所用的方法、规则、组织和模式也都具有西方文化背景。例如论文中参考文献的格式,又如科学研究中的实验方法。我们不必言必称希腊,但应当清楚中西文化的差异。文化差异会影响人们的世界观、思维方式及工作方法。对差异的正确认识有助于我们掌握现行方法、规则、组织和模式。只有熟练掌握现行方法、规则、组织和模式之后,我们才能更好地运用它,改造它,创新它。

对中国人来说,近现代科学技术是一个舶来品,科技期刊、论文也是一个舶来品。

世界上最早的科技期刊诞生于1665年。那一年,法国人萨罗(Denis de Sallo,1626—1669年)创办了《学者杂志》(Le Jovrnal des Scavans)(见图2-1),英国皇家学会创办了《哲学汇刊》(Philosophical Transactions)(见图2-2)。中国的科技期刊诞生于何时,大家看法不一。有人认为英国传教士莫理逊(Robert Morrison,1782—1834年)和米廉(William Milne,1785—1822年)在1815年创办的《察世俗每月统记传》(见图2-3)是中国第一本科技期刊(该刊中文印刷,在马六甲出版,在东南亚和中国广东周围地区发行)。有人认为英国人傅兰雅(John Fryer,1839—1928年)1876创办的《格致汇编》(见图2-4)是中国第一本科技期刊(该刊在上海由《申报》社出版)。有人认为中国留美学生胡明复(1891—1927年)、任鸿隽(1886—1961年)等人1915年创办的《科学》(见图2-5)是中国的第一本科技期刊(该刊是当时中国科学社的会刊,在上海出版。中国科学社是中国最早的现代科学学术团体,它由中国留学生于1915年在美国康奈尔大学创建,1918年迁回国内)。但不管怎么说,中国的科技期刊和西方文化有很深的渊源。

显然,这些刊物上的文章不是“八股”文章。现在中文科技期刊上的论述也没有用中国古代的文言。而且,现今的作者如果想在国际期刊、会议上顺利发表论文,还得能写一手漂亮的洋文。目前,科技界普遍采用的是源自西方的研究方法、表达方式。

图2-1 《学者杂志》

图2-2 《哲学汇刊》

图2-3 《察世俗每月统记传》

图2-4 《格致汇编》

图2-5 《科学》

因此,要写好论文,扩大自己论文的影响,应当清楚现行的相关方法、规则。目前,这些规则毕竟不是按照中国文化传统制定的,中文还不是国际科技界的通行语言。因此,我们应当了解这些西化的规则,掌握它,为发表高质量论文所用。看来,在论文写作上,清代思想家魏源“师夷之技以制夷”的策略也很有借鉴价值。当然,希望在不久的将来我们能成为规则的制定者,中文在世界范围内成为科技交流的通行语言,到那时我中华将鼓舞文明,国民荣光,雄踞于宇宙。

神行太保小密探

傅兰雅

傅兰雅(1839—1928年),英国人,本名John Fryer。他从小受父亲影响对中国有浓厚的兴趣。1860年,从伦敦伯雷师范学院毕业之后,即前往香港的St.Paul’s College任职。1868年,到江南制造局担任首席口译。

傅兰雅

在中国任职期间的博兰雅

1876年2月9日,傅兰雅创办的中文科技期刊《格致汇编》(英文刊名最初为Chinese Scientific Magazine后改为Chinese Scientific and Industrial Magazine)在上海首发。该刊由申报馆印制;刊行7年,前4年为月刊,后3年为季刊;内容包括化学、物理、数学、生物、天文、地学等;装订形式为中国传统的线装;发行地区包括中国(华北、中南、东北)、日本、新加坡;在作者方面,中国人、外国人大约各占一半。

此外,傅兰雅于1874年创办了中国第一所科技专门学校格致书院,于1885年创办了中国第一个科技书店格致书室。他还将一百余本科技图书翻译成中文,内容涵盖数学、物理、化学、医学等领域,为近代西方科技在中国的传播作出了突出贡献。傅兰雅在《江南制造总局翻译西书事略》中这样谈到了他的理想:“惟冀中国能广兴格致,至中西一辙尔。”。

2.1.2 科学、技术、工程不是一回事

科技论文是关于科学或技术的文章。此外,我们也常把和工程相关的论文归到这类论文里。但实际上,科学、技术和工程并不是一回事。

(1)科学(Science)。

科学是关于客观世界(自然界、社会和思维)发展规律的知识体系以及产生这些知识的活动,包括自然科学、社会科学、思维科学。

(2)工程(Engineering)。

工程是获取、运用知识(包括数学、自然科学、经济学、社会学、实践经验等知识),以设计、构造各种机械、装置、系统、材料、结构或工序的活动以及相关知识。

(3)技术(Technology)。

技术是能实现某一功能或解决某一问题的工具、机械、技巧、工艺、组织方法及相关知识Wiki,技术,http://zh.wikipedia.org/wiki/%E6%8A%80%E6%9C%AF.

科学、工程与技术密切相关,又互有区别。简而言之,科学侧重基础理论,工程侧重实践经验,技术介于两者之间。技术、工程成果注重实用性,科学研究成果却不一定能有立竿见影的实用性,但科学研究成果可以应用到工程、技术中形成新的技术。工程实践使用科学研究成果和技术,也会衍生出新技术Wiki,技术,http://zh.wikipedia.org/wiki/%E6%8A%80%E6%9C%AF.

弄明白科学、工程与技术的区别对写好论文来说是很有必要的。作者在写论文时应当清楚自己的研究是属于科学、工程还是技术,清楚取得的是什么性质的成果。不同研究的方法、侧重不同,成果特点不同。

  • 科学研究通常采用实验、理论推导与证明、模拟、数值计算等方法,研究结果包括新概念、定理、基本原理等。科学研究与实践活动并没有太多直接联系。基础研究、应用基础研究通常就是这类研究。
  • 技术研究通常采用与实践密切相关的方法,即便采用实验、仿真等方法,也会在技术应用推广之前在实际环境中进行验证。技术研究的成果通常为新方法、工艺、设计、机制、流程、系统等。与科学研究相比,技术研究更强调成果的应用价值,属于应用研究。
  • 工程研究通常在实践中采集数据,在方法上注重实践检验。工程研究的成果通常为新方案、方法、工艺、材料等。工程研究更强调成果的实用价值,同样属于应用研究Wiki,技术,http://zh.wikipedia.org/wiki/%E6%8A%80%E6%9C%AF.

不同性质的成果在文字表达上有差别,评价要求也不一样。例如,如果一篇论文论述的是科学理论成果,用数学证明等方法就可以完成评价;但如果这篇论文论述的是工程研究成果,只有用源于实践的实际数据对成果进行验证,才具有说服力。同样地,一篇论述技术研究成果的论文,如果没有充分的实验工作做支持,也是不会得到好的评价的。

2.1.3 中国作者的文化、思维特点对论文写作的影响

目前,世界科技交流的主流语言是英文,中西文化差异会不会对中国作者在国际上发表论文有影响呢?

众所周知,中西文化差异很大。中国文化中委婉含蓄、模糊中庸的成分比较多。很多时候,很多事情,国人并不喜欢搞得太清,也不喜欢用精确、量化的词语去表达。有时候尽量模糊,以便留有回旋余地。就拿食谱来说吧,在描述一道菜要加多少盐时,我们往往说“加食盐少许”;而英国人往往说“加食盐××克”(如表2-1所示)。

表2-1 传统的中式、英式食谱描述(以蛋炒饭为例)

注:蛋炒饭一道中外皆宜的餐食。这两个食谱片段分别节选自一个英国食谱网站和一个中国美食网站。它们所用的原料基本一样,只不过英国人将“半勺十三香”换成了“1/4 teaspoon ground black pepper”(1/4茶匙黑胡椒)。从中不难看出两者的差异:英式食谱采用了数字化的精确描述,中式食谱的描述则模糊一些。当然,现在也有不少中式菜谱采用了精确量化的描述。

在科研工作中,模模糊糊不是一种好的作风和习惯。它往往会导致实验设计、数据分析上的疏忽。研究需要严谨的态度,遵循科学的方法。

韦氏词典(Merriam-Webster Dictionary)是这样解释科学方法(Scientific Method)的。科学方法是一个系统地寻求知识的过程,包括以下三个步骤:问题的认知与表述、通过观察和实验收集数据、假说的构成与验证。科学方法及其结果体现在科技论文中就是:问题定义、成果描述、成果验证、数据分析。这些内容是论文必不可少的组成部分。在科研工作中,应从本质上掌握科学方法,并合理、条理地运用到论文写作中。

科技论文通常包括以下几部分:引言、相关工作、问题定义、成果主体(如,方法、协议、算法、结构等)、验证、数据分析与讨论、结论。有人将它浓缩概括,称为IMRaD结构(IMRaD为Introduction、Method、Results and Discussion的缩写,代表了论文最关键的几个组成部分)。从形式上看,它很像一种洋“八股文”(不妨称它为“西八股”吧)。其实,这种格式化的文章结构非常有助于人们将事物描述得井然有序。

尽管科技论文有结构清晰的格式,不少中国作者还是不能很好地掌握这种“西八股”。中国文化中天人合一的成分很多。反映到思维中,中国人擅长形象思维,不擅长逻辑推理,注重意境;相反西方人则擅长抽象思维及严谨的推理,注重细节。水墨画写意,油画写实,传统西方油画和中国水墨画很清楚地体现了这一点(见图2-6)。语言是思维的载体,论文是作者思维结果的书面表达。写作时,最好是用什么语言思考就用什么语言写作,这样比较顺畅。因为人们往往是想什么,就说什么、写什么。由于根植于心的文化背景差异,以中文为母语的人即便能用英文写作,但在潜意识中也往往仍用中文思考。用一种语言思考,用另一种语言写作,或者在东方思维习惯牵引下填写“西八股”,写作要求和思考轨迹可能不一致。如果不注意,就会对写作产生负面影响。

图2-6 中国山水画与西方风景画的差异

例如,有时,擅写意不擅写实等思维特点会使作者对问题的描述比较模糊。在这些作者的论文(无论是中文论文还是英文论文)中,问题定义不清的现象并不少见。结果,审稿人耐着性子看了一串长篇大论之后,却搞不懂作者到底要解决什么问题,看不出作者的成果有什么价值。这样一来,论文的创新点就很难体现出来。

在开始动笔写论文之前,让思路尽可能清晰,让提纲尽可能条理,是非常有必要的。在用中文思考,用英文写作的情况下尤其如此。

例1

在做机器学习与知识发现方面的研究时,牛同学写了一篇关于多标签文本数据分类(Label Text Classification)算法的论文。在论文的引言部分,他写到:

随着应用的不断普及,互联网上的数据及其特征数量不断增加,使现有分类算法面临新的挑战。我们对这些挑战性问题进行了研究……

K教授看后,认为问题描述太笼统,提出了如下的意见:

(1)数据这个概念太不具体。互联网上的数据很多,音频、视频、文本、图片等都是数据。不同数据的特征、分类算法也有差异。既然研究针对的是文本数据,就应将它写明确。

(2)挑战性问题是什么?是计算复杂度的问题?还是其他的什么具体问题?

可见在科技论文写作中,很多地方不能“点到为止”。

2.1.4 中国作者在英文论文写作中应注意的语言文化差异

语言文字是文化的重要组成部分,也是文化的重要体现。John G.Blair和Jerusha Hull McCormack 在Western Civilizations with Chinese Comparisons一书详尽论述了中西语言文化的差异。在这里,综合其他研究成果,探讨一下中国作者在英文论文写作中要注意的语言表达问题。

(1)中文习惯从整体开始表达,语句中可以连续使用多个动词;而英文擅长从局部开始表达,动词很少被连续使用。例如:句子“It mainly described the algorithm controlled the sensors.”中连续使用动词的情况在中文和中国人的思维中很常见,但在英文中就不能这样;应将第二个动词放到从句中,句子改为“It mainly described the algorithm that controlled the sensors.”。这种语言、思维差异需要特别注意。在写作时,应尽量用简短的英文句式,将事物表述清楚。当然,并不是说中国作者不能用复杂的英文句子。但实际情况是有不少中国作者在写复杂英文长句时,往往会出问题。

(2)中文对时态的表达比较模糊,而英文则通过动词形式的变化明确表达动作的时态。英文中有现在、过去、将来三种基本时态,用来刻画动作在不同时间发生以及动作的状态。在用英文写作时,应当正确使用时态。如:对已完成实验的描述要用一般过去时,对普适性结论的描述要用一般现在时。如不注意,可能会出现全文都使用一种时态的问题。

(3)中国人在表达上侧重整体和概念,有时候比较模糊、含蓄,不像西方人那样强调个体并严格地分门别类。因此,中文名词没有单数、复数之分。英文则不同,名词有可数、不可数之别,有单数、复数之分。随之而来的就是不定冠词a/an及定冠词the的使用。中国人在用英文写作时常常不能准确使用名词的单复数形式,并漏掉不定冠词a/an及定冠词the。

(4)在动词的使用上,中文与英文有很大不同。现代汉语中介词很少,古汉语中更少。中文动词后面一般直接跟名词。像“去北京”“到上海”这样的表达在中文中很常见。而英文介词却很多,只有及物动词才能直接跟名词。“去北京”“到上海”在英语中不能写成“go Beijing”、“come Shanghai”,而应写成“go to Beijing”、“come to Shanghai”。这种缺少介词的现象可能与文化传统有关。

(5)在语序上,中文与英文也有不少差异。例如,科技论文写作常采用陈述句。在现代汉语中,最基本的陈述句式语序是“主语+谓语+宾语”。英文陈述句的语序也大致如此。但较之于汉语,英语状语的位置要灵活得多。在现代汉语中状语通常放在主语和谓语之间,而英语可以后置。后置状语的情况在古汉语中曾经有过,现代汉语中已经完全没有了。例如,在“我们在北京做了这个试验”这个中文句子中,状语“在北京”放在主语“我们”和谓语“做”之间,而在与之对应的英文“We did the experiment in Beijing”中状语“in Beijing”后置了,放在了宾语后面。如果按照中文语序写成“We in Beijing did the experiment”那就成了很奇怪的英文了。

(6)就表达的主观性而言,英文要比中文客观、精确一些。下面举两个例子。日常生活中,经常听到中国的父母们这样感叹:“孩子啥时候才懂事啊?”。中文“懂事”是一个主观性很强且含义模糊的词。是长大成人了?还是懂得人情世故了?很难界定,不同父母也有不同的判断标准。在英文中,grow up一词与“懂事”对应,表示长大成人,含义要单一、客观得多王乐平.英语思维是这样炼成的.广州:华南理工大学出版社,2010.。在论文写作中,有些中国作者在需要精确描述实验数据的时候习惯性地使用了模糊的词汇,降低了实验的准确性和可信度。下面是从一篇投稿中摘出的一句话:“计算伪随机数发生器的门电路数目大概为1300。”。读者看了这句话后会有疑问:到底需要多少个门电路?作者是否真的做过这个实验?科技论文中,应当尽量避免使用“大概”这种词。

因此,中国作者写英文论文的时候,最好使用英语思维。如果做不到这一点,就应当注意中英文文化的差异,使写出来的论文在条理清楚之外尽可能符合英文的语言文化习惯和相应的阅读、思维习惯。否则,写出来的英文论文很难被同行看懂,会大大降低发表的机会。

2.2 应当了解的国际规则

2.2.1 不能这样做:一稿多投、重复投稿、重复发表

蟹有蟹道,行有行规。作者在投稿时,必须遵守一些规则,有些事情是不能去做的。如果做了,就会“大家很生气,后果很严重”。以下几点需要作者特别注意。

1.一稿多投

一稿多投的英文名字很多,Multiple Submission、Concurrent Submission、Simultaneous Submission、Parallel Submission都是指一稿多投。看来,它还是一个热点,要不然也不会有那么多雅号。

什么是一稿多投?简而言之,就是同一篇论文同时投往两个以上不同会议或期刊。一稿多投的做法不可取。那么,什么样的论文算作同一篇论文?

两篇论文如果一模一样,那肯定是同一篇了。两篇论文如果内容很相似,算不算同一篇呢?内容实质相似的论文是同一篇论文。美国计算机学会程序设计语言专业组(ACM Special Interest Group on Programming Languages,ACM SIGPLAN)规定:不能将多篇内容实质相似的论文同时投向多个不同的会议、期刊ACM SIGPLAN,SIGPLAN Republication Policy,http://www.sigplan.org/republicationpolicy.htm.。其他专业组织、期刊、会议也有类似的规定。

怎样投稿算作同时?简单地说,作者将一篇论文提交给一个期刊、会议之后,在没有撤稿或被退稿的情况下,再将它提交给另一个期刊、会议,就算同时提交。

有些期刊、会议要求作者投稿时说明是否一稿多投。如果作者声明一稿多投,通常稿件会被退稿或者被要求撤回其他投稿。如果作者不做声明,一稿多投,一旦被发现,就是很严重的问题。会受到严厉处罚。以IEEE Transactions on Vehicular Technology为例,该刊如果发现作者一稿多投,将施以以下处罚IEEE,IEEE Publication Policies,IEEE Press,2011.

(1)立即退稿;

(2)对作者提出警告;

(3)要求作者提交道歉信;

(4)禁止作者在IEEE所属期刊、会议发表论文1年。

不过一稿多投也有例外,那就是多个会议、期刊达成了协议,一致同意同时接收同一篇论文。医学期刊编辑国际委员会(International Committee of Medical Journal Editors,ICMJE)在一份关于投稿的文件中提到了这种情况ICMJE,Uniform Requirements for Manuscripts,http://www.icmje.org/publishing_4overlap.html.。ACM也曾指出当某会议、期刊在征稿启事、作者指南等处公开明确声明接收已经投往某会议或期刊的稿件时,作者可以一稿多投,但同时要对一稿多投做出说明ACM,Policy on Prior Publication and Simultaneous Submissions,http://www.acm.org/publications/policies/sim_ submissions.。不过,允许一稿多投的情况并不多见。

不管怎样,在期刊、会议没有公开声明允许的情况下,一定不要一稿多投。

2.重复投稿

重复投稿(Duplicate Submission)是指作者已经向某会议或期刊投稿,在没有退稿或撤稿的情况下,又将该稿件或该稿件的修改稿作为新稿件重新提交。

重复投稿是不允许的,一经发现,一般会被立即退稿。例如,IEEE Pervasive Computing就是这样来处理重复投稿的IEEE,IEEE PSPB Operations Manual,IEEE Press.。如果一篇稿件被退稿或者撤稿之后再投同一个期刊、会议,是可以的。但第二次提交的稿件比第一次提交的稿件应有所改进,且作者应说明是修改后再投,并说明两份稿件的差异及以前被退稿的原因,否则一经发现就会被退稿,甚至对重复投稿者做出严厉处罚。例如,IEEE Transactions on Information Theory就对“退稿重投不做说明”的作者施以3年内禁止在该刊发表论文的处罚。

3.重复发表与二次发表

重复发表(Duplicate Publication/Redundant Publication)是指已经发表的内容被再次发表。在这里,同一作者的两篇论文如果全部或部分内容实质相同,则被视为重复发表。除非要发表论文的会议、期刊允许,否则同一内容是不能被发表两次的。

当然也有例外,比如,两次分别以不同的语言发表;第一次发表面向专业读者,第二次发表面向普通读者。但无论哪种情况,刊登论文的不同期刊必须达成版权协议。这种情况被称为二次发表(Secondary Publication)。有的期刊出于某种特殊原因会将完全拥有版权的论文二次复发表。例如,1969年,ACM图灵奖获得者C.A.R.Hoare的论文An Axiomatic Basis for Computer Programming在Communications of the ACM第10期首次发表。到了1983年Communications of the ACM为了庆祝创刊25周年将这篇经典论文二次发表。

不过这种事如果放在发表过的会议论文身上,情况就大不一样了。发表过的会议论文在满足一定条件后,可以再次发表在期刊上。

2.2.2 也不能这样做:剽窃与自我剽窃

什么是剽窃(Plagiarism)?IEEE对剽窃是这样定义的:在没有明确声明来源、作者的情况下使用他人或自己以前已经公开的思想、过程、结果或文字是剽窃IEEE Communication Society,Policy on Plagiarism,dl.comsoc.org/livepubs/docs/comsocpubs.pdf.

这里需要特别强调的是使用自己以前公开的思想、过程、结果或文字,不做明确声明,也是剽窃。这种剽窃被称为自我剽窃(Self-plagiarism)。因此,当一篇论文基于以前的已经发表的论文时,作者应说明两者的差别,并对以前发表的内容标注引用。如果不做引用和说明,无论以前论文的作者是他人还是自己,这种行为都将被视为剽窃。自我剽窃是一件很严重的事,但往往容易被人忽视。

IEEE将剽窃分为5级(以下文字整编自IEEE PSPB Operations ManualIEEE,IEEE PSPB Operations Manual,IEEE Press.)。

1级:未加引用的文字复制超过50%。

一篇论文中超过50%的内容来自另一篇或者其他多篇论文,该文作者未对他人论文内容标注引用,没有列出参考文献。或者一个作者的多篇论文存在剽窃,且剽窃内容累计超过50%。

2级:未加引用的文字复制超过20%,不超过50%。

一个作者的一篇论文中有20%~50%的内容来自其他作者的论文,该作者未对他人论文内容标注引用,没有列出参考文献。或者一个作者的多篇论文存在剽窃,且剽窃内容累计在20%~50%之间。

3级:未加引用的文字复制不超过20%。

主要是对论文段落、句子、图表等的复制,累计不超过20%,且未加任何引用标记、参考文献。

4级:没有对略作修改的段落、句子注明引用。

对他人论文中的一些句子、段落略作改动(如调整语序、替换个别词句等),加到自己的论文中,且没有标注引用,没有列出参考文献。

5级:引用标注不完整。

对引用他人论文的内容标注引用,但标注不精确或者参考文献不完整。

对不同级别的剽窃,IEEE制定了不同的处罚措施(以下文字整编自IEEE PSPB Operations ManualMandy Thomas,How the US National Science Foundation(NSF)Manages Research Misconduct,Australian Research Council,2011.),如表2-2所示。

表2-2 剽窃的分类及处罚

由IEEE的相关规定可以看出,一旦发生剽窃,剽窃者会受到留案底、道歉、禁止发表等惩罚。其他学术团体、期刊对剽窃也有类似惩罚。之所以选择IEEE进行介绍,主要是因为它对剽窃界定的比较清楚,惩罚措施制定的也比较详细。

前三种剽窃受到的惩罚很重,但也很容易被发现,发生的概率反倒比较小。后两种看起来并不严重,受到的惩罚相对较轻,因此有不少人心存侥幸而为之。有的在引用他人工作时,在词句上做了改动或者换了一个表述方法,没有给出引用参考文献。有的对参考文献不够重视,列出的文献不全或者不完整。有的列出了却没有引用。

参考文献不全、不完整是一种很常见的问题,也是让编辑们非常头疼的一个问题。其实,它对作者的潜在危害很大。有些作者并不是故意剽窃,只是对参考文献没有足够的重视,结果酿成大错。这个问题对作者来说就如牙疼,牙疼“不是”病,可疼起来真要命。其实,也真会要人的命。当年,吴佩孚不就是因牙疼而死的吗?

神行太保小密探

牙痛真要命

吴佩孚(1874—1939年),晚清秀才,直系军阀首领。1937年抗日战争全面爆发,吴佩孚居住在被日军占领的北京。日本人曾威胁、拉拢他,但他并没有与日本人合作。1939年12月4日,吴佩孚牙疼的毛病复发,引起高烧不退。一个日本牙医给他看过病之后,吴佩孚突然离奇地死去。吴佩孚的死因至今是一个谜,但直接原因与牙疼有关。

吴佩孚

2.2.3 更不能这样做:伪造与篡改

澳大利亚研究理事会(Australian Research Council)的项目执行主任(Executive Director)Mandy Thomas女士曾对美国自然科学基金会(US National Science Foundation,NSF)处理的学术不端行为(Scientific Misconduct)做过调研。她的研究结果表明:在那些案例中,最多的是剽窃,占40%,其次是伪造(Fabrication)和篡改(Falsification),分别占5%和16%Mandy Thomas,How the US National Science Foundation(NSF)Manages Research Misconduct,Australian Research Council,2011.。从中可以看出,伪造和篡改是仅次于剽窃的高发学术不端行为。

那么,什么是伪造与篡改?

  • 伪造就是把本来没有的东西说成、写成了有的,如描述没有做过的实验,编造不曾收集的数据,并记录、发表这些内容。
  • 篡改是指人为操纵研究材料、设备或过程,改动或忽略相关数据、结果,致使研究记录不能正确无误地反映所作研究。

在信息科技领域常见的伪造、篡改行为有哪些呢?

1.伪造

(1)记录、报道实际上并不存在的案例分析、实验,描述实际上并没有设计、构造的系统、原型。

(2)没有做过实验、仿真、模拟,凭空编造结果数据。

(3)为了使结果更好,在实验中将编造的数据与真实数据混杂在一起。

2.篡改

(1)在研究过程中,只记录好数据,忽略不理想的数据,或者修改研究数据。

(2)修改实验过程、时间。

(3)修改统计结果。

(4)在写论文时更改实验方法、模型,使之与实际不符。

(5)在论文中添加不实的或错误的论述。

论文记录的研究过程应当是可重复的,结果是可以再现的。如果在相同研究条件下,研究过程不可重复,结果不能再现,作者就会被怀疑有伪造或篡改行为。

伪造或篡改行为的后果很严重。在某些领域,如飞行器自动控制、自然灾害检测、高速铁路信息系统等,错误的数据会导致灾难性后果。各国对这类行为的惩罚很严厉,除了论文撤稿、禁止发表之外,在有些国家,不良行为人可能面临刑事惩罚。例如:2006年,美国佛蒙特大学医学院(College of Medicine,University of Vermont)的教授Eric T.Poehlman就曾因伪造、篡改数据被判入狱366天Susan R.Morrissey,Research Misconduct Federal Agencies Handle Fabrication,Falsification,and Plagiarism Allegations Differently,but All Take Claims Seriously,Chemical and Engineering News,84(45),2006:18-22.

神行太保小密探

Eric T.Poehlman事件

Eric T.Poehlman是美国历史上第一个因伪造、篡改数据而入狱的学者。1987年,他加入美国公立常春藤大学(Public Ivies)之一的佛蒙特大学(University of Vermont),后来,成为该大学医学院的教授,主要从事人类老龄化和肥胖症方面的研究。在出事之前的20多年间,他共发表了200多篇期刊论文。Poehlman在佛蒙特大学的一位同事Walter DeNino很佩服他,把他当做良师益友。后来,DeNino发现Poehlman有问题,就告发了他。2005年3月17日,Poehlman被控学术不端。之后,他承认在10篇论文中伪造数据,在17项资助申请中篡改数据。2006年6月28日,Poehlman因在研究资助申请中篡改数据被判入狱1年零1天。Poehlman可能也是世界上第一个因学术不端而被判入狱的人。

2.2.4 会议上发表过的论文可否再投期刊

在会议上发表的论文,经扩展之后可以在期刊上发表。例如ACM Transactions on Multimedia Computing,Communications and Applications就接收扩展后的ACM MM会议(the ACM Multimedia Conference)论文。有些学术会议经常将选出的优秀论文推荐给期刊。例如下面三个软件工程领域的著名国际会议都向ACM Transactions on Software Engineering and Methodology和Transactions on Software Engineering推荐优秀论文,这几乎已经成为这三个国际会议的传统。

  • ICSE(the International Conference on Software Engineering)
  • ESEC/FSE(the European Software Engineering Conference and the ACM SIGSOFT Symposium on the Foundations of Software Engineering)
  • ISSTA(the International Symposium on Software Testing and Analysis)

有的期刊,如IEEE Transactions on Industry Applications和IEEE Industry Applications Magazine则要求来稿必须事先在会议上发表过IEEE IAS,Information for Authors,http://ias.ieee.org/images/files/publications/information% 20for%20authors%20rev%201.pdf.

会议论文在重新提交到期刊时,必须:

(1)声明投稿是对会议论文的扩展或修改,说明新投稿与原文的差别。

(2)与已经发表的会议论文相比,新投稿有实质的扩展或修改。

这里需要注意的是论文必须经过扩展或修改,否则就会有重复发表的问题。那么到底要有多少新增内容才不会出问题呢?

不同的期刊要求不一样。有的期刊要求会议论文扩展40%的新内容才能发表;有的则要求至少增加25%的新内容。新内容包括新观点、新研究结果等。如果作者想几乎一字不改在期刊上再次发表会议论文,就必须给出充足的理由。但是期刊一般不会接受这样的论文。因此,想让期刊再次发表会议论文的作者最好至少拿出一个专门的段落说明论文的扩展情况,并且突出两篇论文的实质性差异Eamonn Keogh,How to Do Good Research,Get it Published in SIGKDD and Get it Cited,The Fifteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Paris,France 2009.

对于会议推荐的论文,期刊通常不立即发表。而是重新组织对会议论文的评审,然后根据评审结果决定是否录用。对于作者自行投稿的发表过的会议论文,期刊同样会组织评审。

ACM要求所属期刊在发表会议推荐的论文时,应在论文首页声明该文曾经在会议上发表过IEEE TIT,Information for Authors,http://www.nari.ee.ethz.ch/commth/trans-it/authorinfo.php.。IEEE所属期刊也有类似规定,例如:IEEE Transactions on Information Theory就规定在发表会议推荐论文时要在论文首页以脚注形式添加如下的一句话:“This paper was presented [in part] at ...[and ...].”IEEE TIT,Information for Authors,http://www.nari.ee.ethz.ch/commth/trans-it/authorinfo.php.

不过,也有期刊不做这样的声明。

除了发表过的会议论文外,有些期刊也接收扩展或修改过的已发表的新闻通讯短文(Newsletter/News Report)。例如,ACM Transactions on Software Engineering and Methodology就接收这样的稿件Peter J.Denning,Policy on Prior Publication,Editorial Committee,1987.。发表要求和形式同已经发表过的会议论文相似。

2.3 期刊与会议论文

2.3.1 期刊论文有哪些类型

从形式和篇幅上讲,期刊论文包括长文和短文。长文是对一项研究成果的细致、详尽论述,篇幅较长;短文侧重思想创新以及技术的新颖性,篇幅较短。有时候,一些技术、学术评论也以短文形式发表。在国际期刊中,Regular Paper或Research Paper即为长文,有的将长文直接简称为Paper;短文一般被称作Short paper。也有人从篇幅角度,将Letters、Notes、Research Notes、Brief Contributions、Communications、Correspondence、Brief Paper等归类为短文。

长文、短文是相对的,长短不能一概而论。有些期刊的短文也很长。例如:IEEE IEEE Transactions on Automatic Control的长文(Paper)最长可达32页,Technical Notes和Correspondence类短文篇幅可达12页。在不少期刊,12页已是长文的篇幅。

从内容性质上看,期刊论文通常分为如下几类。

1.研究论文

这是一类最常见的论文,通常大家所说的论文就是指这类论文。研究论文应包括对创新研究成果的完整论述,对某学术领域的发展有积极意义。论文篇幅一般较长,如IEEE Transactions on Automatic Control的32页长文,但一般不会那么长,IEEE Transactions on Computers研究论文的篇幅在14页左右,计算机学报的研究论文长度可达20页。在国际期刊中这类论文被称为Research Paper或Research Article。

2.技术报告

这类论文侧重工程中的关键性、创新性技术或者某种实验验证的新技术。它应当包括对某一技术的完整介绍。论文篇幅可长可短,不同期刊要求不尽相同。在国际期刊中这类论文被称为Technical Report。

3.研究/技术短文

这类论文是对某一阶段性成果或技术的论述。篇幅不长,一般在5页左右。在国际期刊中这类论文被称为Short Paper。

4.通讯

这类论文是对新理论,先进、实用的创新性技术及其他重大发现的简要报道,或者对已发表成果的评论、修正与完善。篇幅在2~6页。这种论文的时效性很高,通常要求尽快发表。在国际期刊中这类论文被称为Letters、Short Communications、Communications、Correspondence等。当然,这里的Letters不是信件的意思,而是一种科技论文。

5.研究简报

内容与通讯类似,但时效性并不高,不要求尽快发表。在国际期刊中这类论文被称为Notes、Technical Notes或Research Notes。

6.短评

这类论文是对理论、技术等的简短评述,篇幅在2页左右。在国际期刊中这类论文被称为Comment Paper。

7.综述

这类论文是对某一研究领域或某项技术的总结及综合性述评,论文可以侧重评论也可以侧重介绍,或者是两者的结合。在国际期刊中这类论文被称为Review(评论性综述)、Tutorial(指南性综述)或者Survey(调研性综述)。论文篇幅一般在8页以上。ACM Computing Surveys的综述文章可达35页。

如表2-3所示,Review、Tutorial及Survey有一定的差异。

表2-3 综述性论文的类型及差别

在写综述的时候,应当注意不同综述论文的差别。一篇好的综述性论文,引用率通常会比较高。

2.3.2 什么是专题、专辑和增刊

作者投稿期刊时,经常会看到专题、专辑与增刊的征稿启事。那么,什么是专题、专辑、增刊?其中的论文与通常的期刊论文有什么不同?

专题是期刊某一期中的一个专门栏目,对某一个大家关注的领域、问题、事件进行集中报道、讨论。专题关注的通常是当前的研究热点,能产生较大反响。例如:IEEE Transactions on Biomedical Engineering曾组织过“Biomedical Data Fusion”的专题;计算机学报曾组织过“物联网”专题;Journal of Applied Physics曾为the 28th International Conference on the Physics of Semiconductors上的特邀论文刊发过专题。在英文中,专题通常被称为“Feature Topic”或“Special Topic Section”,一个专题有时候会有一个或几个特邀编辑(Guest Editor)。

专辑是指期刊的某一期专门对某一个大家关注的领域、问题、事件进行集中报道、讨论。专辑关注的也是当前的研究热点,会有较大的反响。例如:IEEE Transactions on Multimedia曾经组织过“Multimedia Data Mining”的专辑;计算机学报曾经出版过数据库、云计算等专辑。在英文中,专辑通常被称为“Special Issue”,有时也被称为“Special Theme Issues”,一个专辑一般会有一个或几个特邀编辑。

增刊是指在期刊正常出版期次之外,额外增加的期次。例如:通常情况下,一个月刊一年出版12期。如果在这12期之外又额外出版了一期,那么这一期就是增刊。与增刊相对应的正常出版的期次被称为正刊。在英文中,增刊通常被称为“Supplementary Issue”。增刊实质上就是正常出版期次之外的额外期次,它可以关注某一领域、事件,以专辑的形式出现或包含专题,也可以仅以普通期次的形式出现。因此,它不一定有特邀编辑。

专题、专辑、增刊通常要在指定的时间点刊出,因此论文出版周期相对较短。专题、专辑对某一研究方向、研究点的成果进行集中、系统的报道,或者刊载最新的研究成果,反映某一时期的研究水平。因此,通常会有较大的影响。从这个角度讲,投稿专题、专辑对作者而言要好一些。

专题、专辑在收录稿件时,有很强的针对性,对论文水平的要求会比较高。与其征稿方向关系不大的论文最好不要投。同时,投稿论文应反映当前的研究水平或最新成果。这些问题,作者在投稿时,应当注意。

下面是一个专辑的征稿启事模板,专题、增刊的征稿启事大同小异。由此,可以对专辑、专题、增刊有进一步的了解。

××× 期刊

专辑(Special Issue):专辑名称

征稿范围(Scope):

专辑背景

举办专辑的目的与意义

重点征稿的研究领域

时间安排(Schedule):

论文提交截至日期(Deadline for submissions)

审稿结果通知日期(Notification of review)

修改稿提交日期(Revised submissions due)

终审结果通知日期(Notification of final review)

最终稿提交日期(Final manuscript due)

预计出版时间(Expected publication)

特邀编辑(Guest Editors/Co-guest Editors/Associate Guest Editors):

特邀编辑姓名、简介及联系方式

特邀编辑通常是相关领域的专家,负责稿件的征集、评审,并根据评审结果决定稿件是否被录用。特邀编辑可以向自己负责的专辑、专题或增刊投稿,但不能评审自己的稿件,他的稿件将由其他编辑独立安排评审。

2.3.3 学术会议论文有哪些类型

从形式和篇幅上看,常见的会议论文分为长文(Full Paper/Regular Paper/Long Paper)、短文(Short Paper)、张贴论文(Poster Paper)几种。下面分别介绍。

1.长文

此类论文结构完整,对某一原创成果或相对完整的阶段性成果进行较为详尽的论述。长文要经过严格的同行评审(Peer Review)。IEEE会议一般要求长文为6~8页。国内会议也大致如此。ACM会议长文篇幅比较长,如第22届ACM CSCW(the ACM Conference on Computer Supported Cooperative Work)会议长文可达10页,第7届ACM MobiCom会议甚至允许发表篇幅达15页的长文。会议长文写作要求与通常的论文写作要求没什么不同。长文发表后,会被收入正式出版的论文集。通常,作者被要求在会议上报告论文内容。长文录用率一般较低,对质量要求也比较高。有些学术会议在未被录用的长文中挑选质量不错的文章,建议作者修改成短文发表。在学术会议征稿启事或录用通知中,长文通常被称为Full Paper、Regular Paper或者Long Paper。

2.短文

此类论文篇幅较短,一般不超过4页,但也有例外。短文要经过同行评审,决定这类论文能否被录用的关键是内容的“创新性”。论文内容,如方法、模型等,不一定很完善,但一定要原创、新颖。在短文写作上,应该言简意赅,重点突出,中心思想和成果意义一定要鲜明。一般,应使读者在不到1小时的时间内理解短文的核心内容。在结构上,短文一般不包括相关工作、下一步工作、实验或测试细节。

不同会议对短文的处理方式不同。有些会议的短文录用率不高,有的则不是。有些会议不将短文收入正式出版的论文集,有的则收录。有些会议的短文实际上就是张贴论文。短文作者一般不能在会议上报告论文内容。在国际会议征稿启事或录用通知中,这类短文的名称比较多,通常被称为Short Paper、Abstract或Extended Abstract,但也有其他的称呼。例如:国际会议ACM CSCW将长文(Full Paper)简称为Paper,将短文称为Notes,规定其长度不超过4页;并提醒作者应当根据自己研究的进展情况选择写长文还是短文。国际会议ACM MobiCom有时将长文称为Technical Paper或称为Paper,将短文称为Challenges Paper,其最大长度为8页。而ACM MM(the ACM International Multimedia Conference)会议的短文实际上就是张贴论文。详见表2-4、表2-5、表2-6。

表2-4 ACM CSCW 2011的论文要求Call for Participation:Papers and Notes,http://cscw2011.org/cfp/papersnotes.html.

表2-5 ACM MobiCom 2011的论文要求Call for Papers,http://www.sigmobile.org/mobicom/2011/cfp.html.

表2-6 ACM MM 2011的论文要求Call for Full Papers,http://www.acmmm11.org/content-call-full-papers.html. Call for Short Papers,http://www.acmmm11.org/content-call-short-papers.html.

3.张贴论文

此类论文是在会议上张贴、交流的论文。有些会议将录用的短文作为张贴论文,有的将认为不适合以长文、短文形式发表的论文作为张贴论文。通常,国际会议将张贴论文称为Poster Paper,有时候它也有其他称呼,如Interactive Paper。正式出版的会议论文集不包括张贴论文。

上面说到的三种论文,是会议论文的常见形式。除此之外,有些会议还根据自己的特点征集一些特殊类型的论文。例如,ACM MM2011曾征集“High Risk/High Reward”论文。这类论文要么在思想、理论上有很大创新,但实验、验证工作尚不完善;要么给出了一种能够对社会产生重要影响的新型多媒体应用。又如,ACM CSCW 2011曾征集“Showcase”论文,用来介绍某科研小组或工业界在计算机协同工作方面的案例。

除了依据形式、篇幅的分类之外,会议组织者在征稿时还会根据内容性质,对论文分类。常见的有以下几种:研究类(Research Track)、工业应用类(Industry Track)、工作进展类(Work-in-Progress Track)等。下面以第8届IEEE SCC(IEEE International Conference on Service Computing)会议为例对此进行说明。该会议对论文的分类见表2-7。

表2-7 IEEE SCC 2011按内容性质对论文的分类

一般来说,会议还会根据领域方向对每个类别再细分。例如,ESWC 2011(the Extended Semantic Web Conference)将Research Track,细分为Social Web and Web Science、Ontologies、Semantic Data Management等更细的类别。作者可以根据自己的实际情况选择投稿。

2.3.4 期刊论文与会议论文有什么不同

有人说期刊论文水平更高一些,是不是这样呢?也不尽然,像VLDB(International Conference on Very Large Data Base)这样的国际会议发表的论文甚至比一些期刊论文水平都要高。不过有一点是肯定的,那就是会议论文不如期刊论文完善。要不然,也就不会有“会议论文修改或扩充后可以再投稿期刊”这一说了。例如,ACM Transactions on Software Engineering and Methodology就认为会议论文是一种“半熟”的论文,存在内容上的欠缺,评审也不如期刊做的完善TOSEM,Information for Authors,http://tosem.acm.org/Authors.html#PriorPublicationPolicy.。此外,尽管也有比较长的会议论文,但大多数会议有论文篇幅限制。这也是会议论文有“内容欠缺”的一个原因吧(即篇幅所限,有很多问题不能展开论述)。

会议论文的出版周期相对较短。会议召开的时间摆在那里,到了规定的时间,论文是否录用必须要通知作者,会议论文集也要在规定的时间内出版。由于时间上的限制,会议论文的评审比期刊快,对论文也不会要求反复修改。例如,IEEE International Symposium on High-Performance Computer Architecture(PHCA)在稿件提交截至之后2个月左右就会通知稿件是否被录用,作者收到录用通知和修改意见之后大约1个月左右就要提交用于出版的论文最终稿(Camera-ready Copy)。当然,由于赶时间,有些会议也有“萝卜多了不洗泥”的现象。这也可能是不少人认为会议论文质量不高的一个重要原因吧。期刊除了专题、专辑、增刊之外,没有投稿和出版截止日期的限制,作者可以随时投稿,优秀论文也可以随时发表。总体而言,期刊审稿更细致,对论文的修改要求也严格许多,出版周期要长一些。一篇论文复审、修改两三遍才能在期刊发表的情况并不鲜见。有些权威期刊要求更严,论文反复评审、修改两三遍还是被退稿的情况也时有发生。

会议论文和期刊论文的侧重点不同:会议论文的成果不一定完整、成熟,但一定要“新”;期刊论文除了成果的创新性之外,还对完整性有要求,要求是成熟或相对成熟的成果。不少期刊要求审稿人在审稿时对论文所述成果能否经得起时间考验做出评估。当然,不是说期刊不刊登不是很成熟的、新潮的东西,期刊中新闻通讯(Newsletter/News Report)等文体就是为刊载这种文章准备的。但总的来说,期刊更追求经典和完美。下面是计算机学科中的几篇经典论文,大家可以从中更好地体会期刊论文的特点。

(1)C.A.R.Hoare,Communicating sequential processes,Communications of the ACM,21(8),1978.(被引14442次)

(2)Sergey Brin,Lawrence Page,The anatomy of a large-scale hypertextual Web search engine,Computer Networks and ISDN Systems,30(1-7),1998.(被引8360次)

(3)David Harel,Statecharts:a visual formalism for complex systems,Science of Computer Programming,8(3),1987.(被引6751次)

(4)C.A.R.Hoare,An axiomatic basis for computer programming,Communications of the ACM,12(10),1969.(被引4533次)

(5)G.D.Plotkin,Call-by-name,call-by-value and the λ-calculus,Theoretical Computer Science,1(2),1975.(被引1218次)

以上论文引用次数的统计来源于Google Scholar,统计时间是2011年12月31日。其中C.A.R.Hoare在Communications of the ACM上发表的那篇论文被引用的次数最多。在那篇论文中C.A.R.Hoare首次提出了形式化语言“通信顺序进程”(Communicating Sequential Processes,CSP)。Microsoft Academic Search的统计数据显示:自发表以来,这篇论文一直在不断地被引用,见图2-7。

图2-7 1978—2011年Communicating Sequential Processes一文的引用情况

有些人认为会议论文录用率(Acceptance Ratio)高,容易发表。这要看什么样的会议。有一些高水平国际学术会议,论文录用率很低。例如,ACM MobiCom(The ACM Annual International Conference on Mobile Computing and Networking)的录用率仅为10%左右,在这样的学术会议上发表论文并不容易。同样,有一些会议的论文录用率高确实比较高,在这些会议上发表论文要容易很多。在不同的年份,同一个国际会议的论文录用率会有差异。但根据统计数据,还是可以看出某个会议录用率的总体水平。表2-8给出了信息科技领域几个有良好影响的国际会议的论文录用率情况(依据2002—2011年十年内的数据统计,不足十年的会议按实际发生数据计算)。

表2-8 信息科技领域重要学术会议的论文录用率情况