2019年论文查重过关攻略

作者:小编 发布时间:2019-06-04 12:07:09

快毕业了,你是不是正在紧张地写论文?你以为论文写完就结束了吗?对于临阵磨枪、“一周速成”的同学来说,动辄百分之五六十的查重率才是你真正需要担心焦虑的事情!


为了通过查重这一关,很多小伙伴已经不知道查重、降重循环了多少个来回。那么,怎么查重?用什么软件查重?为什么同一篇文章我用了不同的论文检测软件查重率从5%到85%不等?查重之后我又该如何高效降重?


提交论文时应了解的知识点?


系统只接收论文的纯文本内容,对于图片,表格,公式编辑器等内容会被忽略。简单来说,就是把word格式的论文全文复制,然后粘贴到txt格式纯文本下能够保存的内容。粘贴文本提交和上传文档提交两种方式本质上是一样的,对于上传文档提交,系统会把文档中的纯文本提取出来粘贴在提交框内,非纯文本内容(图片,表格,公式编辑器等)会被自动忽略。


论文查重后,总体相似度是如何计算的?


系统先根据换行符把文章切分成段落,然后再根据标点符号把段落切分成句子,再把每个句子分别进行查重检测。


论文的查重粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。目前句子相似度只有文字上的对比,不考虑语义上的相近。如果做到语义上的查重,那我们就没法改重了。


总体相似度 = 相似字数 / 检测字数


被系统自动识别出来的非正文部分(如目录,标题,公式,图表,参考文献等)不参与检测,检测字数一般略小于论文字数。


相似字数 =(句子1字数 * 句子1相似度 + 句子2字数 * 句子2相似度 + ...... + 句子n字数 * 句子n相似度),句子相似度范围0.00~1.00,绿色句子相似度按照0计算。


 抄袭认定的定义是什么?


任何查重系统只是找到论文句子的所有相似来源,查重率高不能直接认定为抄袭。有可能查重系统找到的相似来源是作者本人以前发表的文章。需要老师针对查重报告仔细分析后才能认定论文是否抄袭。


任何两个查重系统的检测算法和对比数据库不可能完全一样,那么就会导致检测结果有差异。对比数据库不同是导致检测结果不同的主要原因。知网拥有最全的学位论文库,如果待检测论文参考了一篇只录入在知网数据库中的学位论文,那么知网查重的相似率会较高,而如何通过修改降低论文的重复率?


首先了解论文查重的算法


(其中i句相似度>50%为有效,<50%记作0)


简单理解:查重时把文章分解为一个个小句,根据某个算法算出单句相似度。把其中相似度大于50%的句子的相似字数加总再除以论文总字数即为重复率。单句相似度这个概念似乎比较玄学,网站没有明确说明算法,但是我们也可以简单理解一下,大概就是“我写的某个句子和已有文献句子的相同字数占该句子总字数的百分比” 之类的东西。最重要的一个信息是:相似度>50%的句子才会被标黄,相似度>80%的句子会被标红。相似度<50%的被标绿并且相似度被计为0。


降低论文重复率的两个途径


(1)降低每句相似字数,以降低总相似字数。


(2)把句子的相似度降低到50%以下,那么这句相似字数直接就变为0了。

.—— END ——.

客服QQ 返回顶部