中国知网论文查重原理是什么？

作者：小编发布时间：2018-05-24 09:44:44

概念普及：中国知网查重软件自身收录海量文献建立对比资源库，通过特定的文献对比技术算法，把待检测文献和已有数据库资源进行对比，进而生成可视化的检测报告，并在报告中标出重复率的部分和重复的来源，并给出相应的建议，比如存在观点剽窃等。然后审核人员根据这些做出最后的判定，是否存在抄袭，到这里，整个论文查重过程圆满完成。

(1)在中国知网查重报告中，标黄色的文字代表这段话被判断为“引用”，标红色的文字代表这段话被判断为“涉嫌剽窃”。

(2)在中国知网查重进行中，检测系统只能识别文字部分，论文中的图片、word域代码、mathtype编辑的公式、是不检测的，因为检测系统尚无法识别这些复杂的内容格式。你可以通过[全选]——[复制]——[选择性粘贴]——[只保留文字]这样步骤的操作来查看具体的查重部分。另外，在编辑公式时，建议使用用mathtype，不要用word自带的公式编辑器。

(3)论文中的表格内容数据是可以识别的。如果表格的内容有很大的重复度，那么可以把表格截图保存，再放到论文中去。

(4)论文中引用的参考文献部分也是会计算相似度的，所以引用的时候，最好的方式就是先理解内容，再用自己的话写出来。

(5)中国知网查重系统对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测，每一个片段都计算出一个相似度，再通过这样每章的相似度来计算出整篇论文的总重复率。

(6)在中国知网查重系统中，是以“连续13个字重复”做为识别标准。如果你能够通过修改，让你的论文任意一句话都找不到连续13个字与别人的文章相同，这样就检测不到。

(7)当中国知网查重系统识别到你论文中有某句话涉嫌抄袭的时候，它就会对这句话的前面后面部分都重点进行模糊识别，这个时候判断标准就变得更严格，仅仅加一些副词或虚词(比如“的”、“然后”、“但是”、“所以”此类词语)是能够识别出来的。但这样子的识别方式有时候会显得不是很智能，可能会扯上一篇完全不相干的论文说是内容相似。

(8)知网的对比文库里不包括书籍，教材等。但有一个问题要注意，当你“参考”这些书籍教材中的一些经典内容时，很可能别人已经“参考”过了，如果出现这样子的情况，那就会被检测到相似。有些同学会说，那我用自己的话去重新写一下，这样就不会被检测到啦。这样的方法，理论上是对的，但实际上是，这些经典的句段，已经有无数的人引用过了，也已经被无数的人通过各种改写的方式引用到论文中去的，所以，要写出一段跟别人不一样的话，还真是有点难度，这个也要拼点运气。

(9)网络上的某些内容也是在中国知网查重的数据库里的。比如：“百度文库”、“道客巴巴”、“豆丁网”、“互动百科”、“百度百科”。作者查重的时候，甚至还遇到很多奇葩的网站，神马“东方财富网博客”、“人大经济论坛”。所以，选择网上的内容时要慎重。

最后提示，论文写作完成后，要想知道重复率是多少，可以借助中国知网查重（http://www.cnki.cn/）软件进行检测，并且在降低重复率方面非常有帮助。

.—— END ——.

上一篇：中国知网论文查重算法和修改攻略到底怎么样？

下一篇：中国知网查重辅导员分享心得

推荐阅读

中国知网论文查重原理是什么？