时间:2017-03-20 编辑整理:早检测网 来源:早检测网
(1)重复发表
在检查中,发现一些作者为了增加文章发表的几率而一稿多投,又或为了增加发表的文章数,将已经有正式书刊号的会议论文集或者电子期刊上发表过的文章,经过略微增减修饰,或原文不变地重新向有关期刊投稿。这些行为违背了期刊的发刊原则,损害了多个期刊的利益,造成了出版资源的浪费。如,有一篇来自布基纳法索和法国某作者的文章经过检查,虽然没有在正文中发现明显的相似度,但是参考文献完全一致,因而与其中单篇匹配文章的相似度高为18%。异常的现象促使我们进一步对其全文的图表数据进行详细分析对比,发现该作者一年前曾在某刊上发表过类似的文章,两篇论文的重复性高达80%,包括一模一样的三个图和一个表格数据,可见完全是旧数据、老资料的重新发表。另外,还有一个代表性例子,我们在平台上对某一即将发表的文章进行最后的检查时,发现完全相同的摘要,进而得知该文作者的博士论文专集已经在线某国大学出版社的电子资源库,而且与其相关的核心部分已经在五年前发表两篇论文。虽然作者认为现在的投稿是博士论文专集的一部分仍可以发表,但是我们认为学科具有即时反应的特点,经过五年的时滞后,论文没有补充新的进展,没有创新,也就失去了重新发表的意义。当然相关的界定标准还有待讨论。
(2)自我抄袭
检查中发现的另外一种比较典型的现象就是论文作者的自我抄袭或者相互抄袭,不可避免地导致高相似度产生。相当一部分作者持有这样一个观点,即已经在其他刊物发表过的内容,基于同一个研究课题的不同方向,由于采用的材料设备和方法相同,因此在新投稿中,尤其是引言、材料方法和讨论部分重复使用已经发表的内容应该是合理的。这种论调从理论上是经不起推敲的,因为已经发表的文章意味着原创内容已经公诸于众,再次充填于新文中对作者本人有拼凑之嫌,对期刊来讲是浪费出版资源,更重要的是对读者来讲,严重地浪费了他们的时间去面对这些有失原创水准的章节。如果重复用一些相似的内容写一篇新的论文,何不把两篇合并成一篇高质量的文章发表呢?爱思唯尔科技部中国区副总裁安诺杰指出:“研究人员会发表一系列相似的论文,这对期刊编辑来说是件很痛苦的事情。因为这五篇文章实际上可以写成一篇很好的文章。在美国或者欧洲却很少出现这样的情况,因为当科学官员或者基金官员在查看出版记录时,他们会看具体的论文,如果发现五篇论文都有相似的主题和重复的内容,他们会认为这样做是不严肃的”[9]。科学的重要性不是通过数量来衡量的,而是要看论文本身的质量。
(3)搬来主义
还有一种现象在生物医学领域的论文中比较常见,如作者直接复制他人的试验方法和操作描述,然后在试验条件和数据上更改替换。有些作者坚称这种试验方法借用经典文献的表达是正常的,且在多个期刊上常见。对此,我们与国际同行进行了讨论,并研究了一些国际知名期刊(如《科学》(Science)、《自然》(Nature)等),几乎没有发现类似现象。而且在理论上,这种说法也是不合理的。虽然大多数的科研是在结合前人研究成果的基础上,借鉴或重复他人成功的方法试验新的材料,探讨新的结果,但是作者在撰写论文的时候,除了应该引用经典文献外,应该根据时间、地点和条件,用自己的语言去描述自己的工作,总结自己的观点,因为语言描述也是一种原始创造过程。
(4)东抄西凑
在检查中发现有极少数文章,几乎全文大部分的内容都能找到与之相匹配的对比文献,甚至大段内容的相似,甚少用自己的语言描述。造成这种情况很可能是因为作者整篇文章的写作是靠东抄西凑完成的。这样的论文反
映了作者对待科学研究极端不严谨的学术态度。
(5)随意摘用
此外,在检查中还发现有些作者在引述他人的观点或者描述他人的科研成果的时候,文章中大段的句子与匹配的对比文件相似,却没有文献出处。这样会误导读者认为是作者自己的观点,极易引起版权纠纷。这种取向或许是因为作者英文写作上的先天不足而去模仿他人的表述。他们从主观上并没有抄袭之念,只是在写作的时候没有做到模仿量的恰如其分。还有一种现象是一些作者认为只要注明了文献出处,就可以直接大块照抄他人之段落,这些表现在认识上有误区[10]。哈佛大学关于“抄袭”的规定指出:“如果你的句子与原始资料在观点和句子结构上都非常相似,并且结论与引语相近而非用自己的话重述,即使你注明出处,这也是抄袭。你不能简单地改变原始资料中的几个词语或者对其进行摘要性重组,你必须用自己的语言和句子结构彻底地重塑你的总结,要不就直接引用。当然对于已经成为学术界的常识经典名句、即使不做说明也不会对提出者的归属产生误会的观点,则可以不注明出处[11]”。
不同体裁的相似度问题
值得强调的是,论文体裁不同,其相似程度也有所不同。如研究论文,尤其是以科学创新和独特见解为特点的科学快报,作者在撰写文章的时候应该充分体现出文章的原创性;而综述性论文是对某学科历史和现在的科研成果进行总结评述,并结合自己的观点进行分析和讨论,引用参考文献较多,因此,论文总相似度较高尚属合理范畴。但这并不代表可以大量复制他人的文章段落组合综述论文,作者除大量逻辑性引用参考文献支持其观点之外,主要应该用自己的原创语言进行阐述和论证,以期达到学科领域内综述之引领作用。
尽管因为体裁不同,论文的相似度的总量有所不同,但是与单篇匹配文献的相似度的要求却是一致的。一般来说,与单篇匹配文献的文本重叠少(如200个单词以内)为合理引用借鉴;如出现大段文字重叠相似,或单篇匹配文献相似度超过5%,或论文总相似度超过50%,我们应该高度警惕,具体分析被检测文档和高相似度的匹配文献全文,分析判断其引用的合理性。
时滞效应与多次检测的必要性
另外,工作实践中证明至少两次检测是必要的。如图2所示,该论文在评审过程中初次检测报告显示为较低相似度,表现为合理正常的引用。然而一个月后在论文正式排版发表之前再次检测,却出现极高的相似度。报告中显示了新的匹配文献,大量的内容重复,单篇文献相似度高达36%,其原因应该是数据库的实时更新。