留学论文的重复率计算通常遵循以下步骤和原则:
确定重复文字数量
重复文字识别:论文查重系统会将提交的论文与数据库中的文献资源进行比对,识别出与已有文献相同的文字或段落。
连续字符判定:多数查重系统会根据连续出现一定数量(如13个)的相似字符来判断为重复部分。不同系统的判定标准可能有所不同。
确定论文总文字数量
总字数计算:论文的总文字数量是指论文中的全部字数,包括正文、摘要、参考文献等部分。但具体是否包括某些部分(如参考文献列表中的字数),可能因系统或学校要求而异。
计算重复率
重复率公式:论文重复率 = (重复文字数量 / 论文总文字数量) × 100%。
结果展示:查重系统会自动计算出重复率,并在查重报告中详细列出重复的文字、来源以及具体的重复比例。
查重系统的工作原理
分词:将论文和数据库中的文献都进行分词处理,将它们分解成一个个的单词或短语。
比对:将论文中的每个单词或短语与数据库中的文献进行比对,找出相似的部分。
计算相似度:根据比对结果,使用特定的算法计算论文与数据库中文献的相似度。
给出重复率:根据计算出的相似度,给出一个相对的数值,即重复率。
注意事项
阈值设定:不同的查重系统可能会有不同的算法和数据库,因此计算出的重复率可能会有所不同。查重系统通常会设定一个阈值,例如知网,单篇文献引用低于3%的一般检测不出来,若高于3%,则会算入重复率。
格式和引用:作者在引用文献时要正确书写格式,格式错误的情况下也会被算作重复率。
非正文部分:被系统自动识别出来的非正文部分(如目录、标题、公式、图表、参考文献等)不参与检测,检测字数一般略小于论文字数。
通过以上步骤和注意事项,可以较为准确地计算出留学论文的重复率,从而确保论文的原创性和学术诚信。