时间:2014-03-12 编辑整理:早检测网 来源:早检测网
科技期刊中的学术不端行为常见的有抄袭,剽窃他人成果,自我抄袭,伪造、篡改数据,不当署名,一稿多投,一稿多发等,而如何最大限度地减少此类稿件的发表,提高论文质量则是提高科技期刊质量和声誉的关键所在。近年来,由于受社会转型期各种因素的影响,国内学术不端的行为愈演愈烈,一些科研人员,学者甚至是大学教授、院士被频繁报道,学术不端已成为严重影响我国学术水平和学术声誉的不正之风。学术不端作为一种社会现象对学术界提出了新的艰巨任务。2008年底科技期刊学术不端文献检测系统AMLC面世,本刊于2010年3月正式启用该系统,现结合本刊实际情况,谈几点应用体会与建议,与广大编辑同仁共勉。
在没有使用AMLC之前,本刊编辑部对稿件的查重查新是通过期刊数据库和利用网上搜索引擎来检索。在通过期刊数据库检索文献时,大部分不端文献都可利用该数据库提供的检索功能通过题名中的关键词或作者姓名检索出来:在利用网上搜索引擎如goole、baidu、sogou等对准备刊登的文章进行搜索检索,基本上也是题名,作者名,关键词检索这种单一的查询法,而这些搜索引擎只能作为期刊数据库检索的辅助工具,在利用搜索引擎检索到疑是不端文献后,还需要通过期刊数据库将检测到的相似文献下载,后与被检测文献进行对比,以确认该文献是否存在学术不端行为,并且部分不端文献,如对于不同语种发表的内容相同或基本相同的不端文献则不易被发现。同时这些都需耗费大量的时间和精力反复查询,而且还不能保证查询的全面性和有效性。进入AMLC系统后,将待检的论文题名,作者名进行填写后,上传文件,系统进行后台比对,很快就可以查询到检测结果,页面详细地列出了文字复制比,并用不同的颜色标以重合字数或重合百分比的大小,以及本人或非本人的相似文献,文献来源,是否引用及发表时间等,而且可以对相似文献进行全文比对,用显著的红色标出检测论文与被比对论文中相同的文字段,并提供诊断类型(来自作者已发表文献、轻度段落抄袭、整体抄袭、句子抄袭等)供编辑参考。
结合本刊的实际情况,笔者分析了自2011年1月至10月间上传的来稿,共上传检测自由来稿1396篇(期间所收专栏文稿38篇和部分质量很差直接退稿的未上传),检测结果如下:无问题记录的有230篇,重合百分比为〈40%的有328篇40%~50%的有59篇〉50%的有477篇,其中〉80%的有302篇。为了给以后的工作带来更多的便利,也为了使AMLC系统更适合农业科技期刊的使用,我们对检测认为有问题的论文进行了重点排查,与相似文献进行了逐一比对有如下特点。
对重合百分比〉80%的302篇文献进行了逐篇分析,与其相似的文献进行了逐篇比对,发现有278篇属整体抄袭或多源抄袭现象,有24篇为本人在其他刊物上的已发文献属一稿多投现象。在对278篇整体抄袭的文献进行全文比对时发现,有188篇的作者比较集中固定,而且篇幅都较小,比对结果显示,这些文章都属于栽培经验、技术交流方面的文章。对此我们在作者库中对这些特定的作者标红以示区别对其以后的来稿要重点检测 对重合百分比为50% 80%的175篇文章AMLC系统诊断类型大多为多源句子抄袭在与疑抄袭的文献进行了比对时发现重复部分大都为农业科普知识或品种介绍还有少许他人的研究方法试验原理等 对于这类文章如果作者文章中有自己的创新点有自己的核心内容一般可以通过发表而如果作者只是拼凑别人的内容没有自己研究的实质性内容一般做退稿处理 对重合百分比为40%的328篇文章查重得知重复的部分大多为一些格式化的表述如对实验材料和方法的描述这类型的文章即便是文字雷同也不应判为剽窃或抄袭。
AMLC主要功能为科技期刊编辑部对已发表文献检测、论文实时在线检测、问题库查询以及建立对比数据库,这给编辑工作带来极大的方便。AMLC的成功开发、为科技期刊抵制一稿多投、重复抄袭等学术不端行为提供了有力武器、我们应该加以合理利用,使其功能得到最大化的发挥,同时,AMLC依然有提升改进的空间,这就需要多措并举,使其日臻完善。
在初审时,将电子文稿通过AMLC端口上传后,很快就能得到检测结果,不仅用不同的颜色来显示文字复制比,还将相似文献逐一列出,包括本人及非本人的相似文献,文献来源是否引用及发表时间等,而且可以对相似文献进行全文比对,然后根据检测结果进行判断,给编辑工作带来了极大的方便。
审稿专家库是科技期刊最重要的资源之一,编辑部通过AMLC对来稿进行检测,然后对列出的相似文献进行全文比对,在显示两者相同部分的同时,还可查询到作者的专业及其他相关信息,然后据此可以便捷地找到对口专家进行审稿。
通过AMLC初审稿件后,将通过检测达到送审标准的稿件加入个人比对库,在通过作者反修,专家终审进行修改后,可通过AMLC检测系统,将修改前后的文章进行对,比前后不同之处便一目了然提高了编辑的工作效率。
对已发表文献进行追踪查询,对不良行为作者进行统计分类,给编辑部工作提供了方便。AMLC已成为提高我国科技期刊质量,遏制学术不正之风的重要手段。
全文比对数据库不够完备,目前系统虽然收录了期刊、重要会议论文、重要报纸、年鉴、工具书等的信息,但还有大量的会议论文、图书、文件及网络上传播的电子数据等并未被收录到相关的数据库中,检测系统无法追踪,因而受数据库限制,检测结果也可能出错,在一定程度上加大了稿件的处理难度。这就需要完善全文比对数据库的内存。
相关期刊编辑部之间建立查询数据库,任何一个编辑部都无法检测到被检测文献是否与其他编辑部发表前的文献存在抄袭、剽窃、一稿多投等学术不端现象。即使是同时期发表,也很难被检测出,因为AMLC有期刊出版两月后才上网收录的盲区。因此,相关期刊的编辑部之间可共同建立一个查询数据库,这样,每个编辑部都可以通过该数据库与其他编辑部的来稿、已录用稿件进行及时比对查重,在线实时查询新稿件是否存在学术不端行为。各编辑部需有自己专职编辑来管理稿件数据库,其他编辑部无法看到。实行编辑信息网络化、稿件数据共享化、编辑活动公开化及建立具有查询、查重等功能的全国各类稿件的网络数据库中心,同类期刊联合为作者建立诚信档案。加强国内外知名数据库间的有效连接,可以便捷地检测出那些跨语言拼凑的不端文献。
文献通过AMLC系统进行对比后,能够快速检测出与其他文献的雷同比例,但到目前为止,依然没有一个统一的标准和法律法规来界定雷同比例多大即为抄袭,因而对学术写作规范的理解和对杂志所属行业的把握就成为各个编辑部在具体操作时的主要依据。比如对于拼接论文有的编辑部认为是抄袭,有的编辑部认为仅仅是文章质量存在问题。因而,相关部门应该尽快制定统一的标准和规范化的学术指南,这样便于鉴别学术不端行为净化学术空气。
检测系统为界定引证,抄袭和剽窃提供了非常实用的技术手段,大大提高了编辑的工作效率。但若编辑单纯地将此结果作为取舍稿件的唯一标准则是很不科学的。由于检测系统只是机械化地执行程序,检测结果绝大部分是机械的,而一些实际的情况却非常复杂,因而不宜将检测结果作为定性的依据,编辑应将其作为参考依据,充分发挥自身的主观能动性,利用自身的综合知道,结合专家审稿意见,准确,全面地理解文章的重合率,具体问题具体分析并,对文章做出准确的判断。
由于农业科技类的文章一定程度上有其固有格式,对那些非常格式化的表述就要擦亮双眼。在大量前人研究的基础上所进行的自然科学的研究,不同作者对研究方法,试验原理,试验方案或操作环节的描述类似甚至相同。但若文章有其独到之处及创新点,即使雷同也不应视为抄袭。特别是对研究成果创新性的判断必须由具有相关知识和辨别能力的专家来完成。由于AMLC系统对数字和符号不敏感,对只有数据和符号不同的两句话,会被系统检测为重复,实际上这并非重复。恰当引证是知识传承过程中的一个重要环节,不同类型的文章对引用,复制和抄袭的界定标准应有所不同。比如,本刊的试验研究栏目,报道的是最新的科研成果的学术性方面的文章,这类文章要求就要严格一些:在经验技术栏目中,报道的是应用性的技术类文章,这类文章则不宜过分强调:对于综论,综述性文章。由于这类文章一般要介绍或综述现有的研究成果,研究动态和进展,适度的引文量是必需的。
目前,网络上出现了许多反抄袭的方法,由于检测比对的是相同字段而不是相同意思,所以改词换句稍加自己的话用不同的句型表示含义相同的话,打乱段落顺序删除一些词句,整合这些方法可有效降低复制比,这给界定是否抄袭带来了一定的难度。编辑人员要积极发挥主观能动性,不断提升自身判断能力的同时还需要与作者和审稿专家加强联系。
文献经AMLC检测后依然需要人为辅助求证,并且难以自动检测伪造,篡改研究数据和研究结果,作品不当署名等问题,只能提供一些线索供参考,因此编辑部和作者应签订无学术不端的协议,这种做法是作者对自己的行为负责,可在一定程度上避免学术不端行为的发生。
AMLC是个非常实用的初筛工具,为识别和遏制学术不端提供了有力的技术支撑,在一定程度上针对学术不端行为可能带来的严重后果和恶劣影响起到了科技屏蔽作用,最大限度地遏制了有抄袭可能的论文得以通过并发表,在防止学术不端行为进程中发挥了重要作用。但做好科技期刊是一项系统工程,需要行业和社会的共同努力,既要加强行为主体的学术道德自律,提高法律意识,最大限度地发挥编辑的积极主观能动性,也要尽快建立和完善科学的学术评价,职称评定及研究生培养体制,从根源上杜绝学术不端的行为这样才能有良好的学术环境。
贺晋瑜 杜学梅 李敏生 赵彦华 陶 玲 籍艺文