时间:2015-11-11 编辑整理:早检测网 来源:早检测网
我们已知的检测系统有这么几个:知网、PaperRater、维普及万方等。
这些论文检测系统都是差不多的的,比的就是对比库的资源,谁的比对资源丰富,检测就比较准确,计算重复的文字在你文章里的比重,算法类似于百度的关键字匹配,这么说,大家也就明白了,你简单地把一个句子的各别词换成同意词,把字句变被字句,加一两个“的”等是不行的,除非你把句子40%的词都换了。
论文检测的一句有50%重复被认定为重复句,举个例子,现在的系统都把分号与句号当作分句符,PaperRater把这个最小句长设为6,这意味着小于6个字的句子无论怎样都不会被认为是重复的,因为你没有到人家检测的门槛。知网的好像是13。
相似的阀值指和原文相似多少以上为重复,举个例子,PaperRater论文检测系统把你的文章中的文字分为四种红字、橙字、绿字与黑色,分别表示红字表示严重抄袭,橙字表示轻度抄袭,绿字表示引用,黑色表示原创。这样将文章中的句子分为两类:抄袭与原创。同时,还要说明一下,这个阀值有可能不是固定的,一般系统会设一个重点检查的论文,比如说,你抄文献A的比较多,知网查出你的文章与A的重复度在5%以上,系统就会重点查A,如果你这句子与A有50%的相似也可能会判为重复。
我所理解的论文检测系统的大概原理也就这些了。下面介绍下我们常用的系统:知网与PaperRater。知网是官方的系统,大部分学校用的都是知网,当然我校也是;PaperRater为一个公司开发的,因为操作方便、不太贵且非常严格,被我们广泛使用,我个人只用过PaperRater。因为,只有校方的人有知网的入口,他们在淘宝上买,一次要300,而且经常要改的话可能要检数次,对学生是一笔很大的开销。除此外,至于我为什么没用知网查,就是因为没必要花这么多钱,PaperRater就能满足我的要求,PaperRater查一次是一千字1元,我的正文纯字数4万,加标点近4万5,检一次45元。PaperRater由于参数严格,所以结果会高于知网的,至于高多少这没有准。
下面说下我的论文查重方法,就简单地用了几招:
1.尽量用长句,相当于加大基数。减少重复的几率。
2.拼凑,把几篇文章中的同一意思的几个句子,拼成一句,把它们连接起来,就成为新的的句子了。
3.翻译,翻译国外的论文基本不会发生重复,而且从道义上讲也是合理的,翻译也是自己的工作,是为学术做了贡献的。毕竟,那些评你论文的教授们也没打算让你有什么开创性的成果,有自己的工作就可以了。
4.看一遍原文用自己的话去阐述,这也是个好办法,起码自己是完全懂了的。
个人建议用后两种,论文查重系统的设计不是为了查重而查重的,设计的初衷还是希望小硕们尽量原创,设计的原则是“在微小的创作,都值得被保护,真真假假,一验便知”,在学位没问题的前题下,还是自已多多原创吧!