本帖最后由 幸福象花儿一样 于 11-5-2016 16:32 编辑
Similarity Index指的是论文最终的重复率,其中包含Internet Sources(互联网來源)、publications(出版物)、student papers(学生文稿)。
Internet Sources指的是billions of active and archived web pages from the internet.;
publications指的是a repository of frequently updated content from professionaljournals, periodicals, and publications;
student papers指的是a repository of papers previously submitted by Turnitin users。
因为同一处文字以上三处都能检测到,所以三者相加的结果要超过相似度指标,三者可能存在交集,不是简单的叠加关系。
目前,没有一个很直观准确的标准来界定什么是重复、抄袭,任何检测报告也是仅供参考。 个人认为,5%-8%以下比较合适,15%以上要大改。具体的标准请按学校、老师或者编辑部的要求。 同时,有的老师也对重复率的最低值做要求,无重复率、无引用的研究有闭门造车之嫌,因此,也不能偏执于太低的重复率。 部分SCI期刊要求很高,低于5%较好,有sci期刊要求各单项来源低于1% 修改抄袭部分的原则是用相近的词语去替代你抄袭的部分:就是用你自己的语言去表达抄袭部分的意思。 一句话有七个左右的单词与别人重复,都能被系统测到,不管连续或者不连续。 1.为什么一次带reference检测、一次不带reference检测,正文同一部分检测的不一样? 删掉reference检测会影响系统的敏感度,进而影响到正文的检测(本主3年检测经验亲证)。本站建议带上reference检测,这样才能保证跟学校或者编辑部检测结果的一致性。
2.不论引用这是未引用的,只要是重复的都要修改,否则无法降低重复率,除非你们老师或学校认可引用的不算重复。 一般直接引用的最好要转述一下,不要直接引用,除非学校或编辑部认可直接引用不算作重复。
3.明明我复制了别人的内容,为什么检测之后重复率很低或者是0%? 答:任何一个系统都不能包罗万象,收录所有的文字,如果你复制的文字不在系统的数据库里,就会出现检测结果很低或者是0%的现象。如检测结果为0,说明官网检测结果也是0,并非未检测,并非不准。只能说明你的论文在TurnitinUK检测系统中没有重复的,即使你去TurnitinUK官网检测也是这个结果。有些老旧的书本是没有被收录到数据库。
同理,有人讲,明明我是引用书本里的,为什么显示跟别人的论文或者作业什么抄袭? 根本原因在于数据库没有收录书本,但是前面有人引用了该书本的内容,那么再引用该书本就会造成跟前人的作业或者发表的论文显示重复。针对这样,最好还是正确引用,正确标注。 4.Reference 为什么被标全部重复?reference 即使重复了也不能修改? 答:一般情况下因为reference list 是有关作者、书名或文章名、期刊名、出版日期等,属于固定的客观内容,一般不会被认为是重复,因为有很多人引述或者在数据库内,基本上都会被标记,所以标记了,也不用修改,只需要关注正文里的原创内容是否有重复,将正文里的重复内容修改到不被系统检测,就合格了。
5.为什么一句话几个单词也被显示重复? 答:一般是7各单词以上会被系统查到重复,并且不是分布在某一句话,一般是分布在前后几句里,不一定是连续的。
6.为什么跟学校有不一样的结果? 有些学校只测正文,有些测正文和参考文献,有些甚至连声明、致谢都测。学校测的内容一旦有差异,结果就有少许差异。但是如果你提交检测的论文和提交给学校一样,没有任何改动,那么结果是一样的。
7.同一论文Turnitin前后检测结果出现差别的原因分析 偶尔会出现在本店检测重复率较高,而学校检测重复率较低的现象,或跟上述现象相反的情况,或者同一论文,第二次修改后检测后的重复率比第一次还高。主要原因有以下几种可能: 一、买家针对检测报告进行了一定程度的修改,降低或者提高了论文重复率; 二、不同的学校对论文有不同的处理和认定,极有可能是学校排除论文中合理引用,降低了重复率;
三、有的学校用的是turnitin uk或者turnitin,而购买的检测系统跟学校的不一致,比如学校用的turnitin uk,而学生本人用的是turnitin系统提供的服务。反之亦然; 四、在本店检测的时间距离正式提交学校检测的时间较长,或者同一篇文章在本店分别进行2次检测的时间间距较长,恰逢在这段时间turnitin或者turnitinuk系统的数据库进行了更新,收录了新的材料,以前不由被测出的内容被检测到了。 五、因为同班有很多学生都是一样的作业,不可避免的很多同学都会用到相同的内容。假设,a和b两个学生用到同一段内容,且该内容在系统中无法查到。a在1号提前用系统机型检测,结果为0%。但是2号b提交到学校系统里,3号a交到学校系统,因为a提交的时间晚,就会显示跟b提交的那个记录重复。(针对这一情况,提前检测后立即交到学校系统,尤其是同一班级写同一题目,提交的越早越有利,提交越晚越被动。)
六、前后检测的篇幅不一样,字数的增减会影响论文的重复率。系统极其敏感,整篇检测某一一句或者段落可能显示有重复,但是将那一句或者段落单独检测,结果可能显示不重复。 8、数据库强大,全球最权威的检测系统,英美等国家必选系统,
主要包括: ACM, BMJ Publishing Group, Elsevier ScienceDirect, IEEE, NaturePublishing Group,
Oxford University Press, Sage, Informa UK (Taylor & Francis),
Wiley Blackwell, Springer, Sage, Am. Institute of Physics,
Am. Physical Society, Am. Psychological Society, AAAS, ACS,….etc.以及全球互联网网页。 ————————————————– (此处为引用别人)
turnitin 提供的similarity index (SI) 只是一个总体的指标,一般20%以下都是认可的,因为只要你有quote,哪怕是做好了reference,turnitin的系统也会识别出来,还有就是turnitin还有一些比较死板的地方,比如对单双引号的识别不同,比如你的设置上没有排除一些你的领域的专有名词或是3个相似词组,也会对这个SI有影响..
一般的大学老师都是有基本的认知的,不排除有一些只看这个总的百分比,还有就是都会有second marker,不排除她/他对你所写领域非常清楚地情况,因此据我了解的情况,老师会看百分比 (因为他们在接受training的时候,会被反复告知,这个SI不能被单独使用来界定剽窃),所以他们会把具体的被highlight的地方拿出来看,比较认真的老师甚至会把任何一条相似的地方都拿出来一一检查. 百分比本身不能体现一个论文是否有抄袭的嫌疑.我给你举一个例子
如果你的论文是社科院的,比如英国文学里莎士比亚研究,那就会涉及到大量的文献引用和讨论,我知道的有博士论文turnitin的SI达到43%,也同样通过的,因为这是这类论文的一个本身的特点,只要文献是正确引用的.高也不怕.比如某些历史学科,需要引述很多史料。
但反之也有SI是不过12%,但具体到检查也12%的相似度时,发现这12%没有正确引用,那也可以被判为是剽窃.(遵守学术规则,正确引用) 个人建议是如果你做了turnitin,那就把报告拿出来,找到highlight的地方细细对照,因为报告上都给出这个相似处的出处和链接,根据这个找到原文的出处,做好reference即可. 这个东西可大可小,但是一旦被察觉,问题很大.所以小心谨慎的态度是对的. (此处为引用别人)———————————————–
可以用来修改重复语句,迅速降低英文论文重复率
§ 精心设计,版本不断更新 § 高智能实现自动句式转换 § 提供的同/近义词替换充分考虑其在句子中意思的适应性、准确性 § 不只提供单词的替换选择,而且提供词组的替换选择 § 便捷的编辑界面 § 清楚标明修改了的地方,实时统计5词连续重复率,并提供红字显示仍然重复的地方
避免抄袭的方法: 引述、摘寫、改寫(其中的一種或者多种方法)
引述(quotation)
• 直接將他人論文中的文字完整放到自己的論文
• 避免直接引述過多文字, 超過40個字以上要獨立分段並縮排
摘寫(summary)
• 濃縮字句,摘出原文的主要論點
改寫(paraphrase)
• 將不同出處文章整理合併,保留原論點,但加上自己的詮釋觀點
引用(citation)
• 指出原作者與出處 如果我那句话是完全引用,但是学校默许这样做,怎么处理? 引用的内容加上英文的引号,就可能被系统识别。相似度,关键是有没有加引号。 尤其在引用的时候。 如果没有引号,被发现有一大段重复,就是抄= plagiarism.
论文修改的七大误区:
1、将大段落分割成小段落
2、文章中所有的字间插入空格
3、抄袭那些没有在数据库中的书籍 书籍中经典部分很可能已经被人引用而进入数据库,容易躺枪。
4、不同文章抽取不同章节拼接成新文章 CNKI是以句子为最小单位的,这对抄袭检测的结果影响几乎为零。
5、将抄袭句子的后面标注参考文献 知网在检测专用术语中有两种库:一种是抄袭库,一种是引用库。断句的时候,当发现一句话,来自于抄袭库,他则算是抄袭,如果发现是引用库的时候,则算引用。他只以两个库为标准,所以建议不要过度引用。
6、打乱一句话的顺序 知网、PaperPass都采用模糊算法,只要关键词不替换就会标红
7、直接删除标红的句子模糊算法会自动关联前后句,这样修改会引起“蝴蝶效应”。 论文修改实战攻略
1、外文文献翻译法
2、变化措辞法(更换关键词、重写等)
3、掐头去尾留核心,同义替换
4、Google双向翻译法(文字功底)
5、转换图片法(投机)
6、插入文本框法(投机)
7、自己原创法(伤脑筋)
PaperPass网站诞生于2007年,是全球首个中文文献相似度比对系统,运营多年来,已经发展成为最权威、最可信赖的中文原创性检查和预防剽窃的在线网站。 下面总结几个常见问题:
一、有些书籍的年份久远,知网等检测系统没有收录这些材料,大段大段的copy是不是很安全?也有同学认为,数据库大多是往届学生论文和期刊的文章,书本和政府工作报告等暂未入库,直接抄书一般也不会“中招”。
答:这些做是存在风险的。第一,虽然中国知网没有收录书籍,但是可能存在a同学或者老师,他同样也抄了同样的内容,并且已经将其抄书的论文发表了,中国知网能数据库全文收录a的文章,那么你再抄同样的内容,在进行论文检测的时候,很可能指向a的文章,将会被认定为抄袭。www.turnitinuk.net “但如果所抄书本,前几年有人抄过,还是会被测到,因此大家会选择最近两年出版的新书来抄。”但是,新书也可能存在抄别人或者被别人抄的现象。另外,在论文评审的时候,评审专家的经验和理论水平比较丰富,你大段的引用可能被这些老专家们发现,到时候结果就很悲催了!
二、现在有些网页上也有很多相关材料,撰写论文能不能复制上面的内容?比如百度文库、豆丁、维基百科? 答:也是很危险的。网页很大程度上来源于期刊网,不少文章是摘抄期刊网上的文章,通过n篇论文粘贴复制而成。另外有些数据库已经将互联网网页作为数据库的组成部分之一。
三、在学校进行毕业论文检测检测之前,通过淘宝上卖家将自己的论文提前进行检测,针对检测结果,对重复的部分进行修改,最后通过论文检测系统是很轻而易举的了 答:中国知网新开发了文献提前检测预警,如果同一篇论文先后两次进入检测系统进行检测,那么将提示高校,该论文已提前通过其他账号进行检测。如何处理这样的情况,没有出台硬性的规定,估计要看高校学术委员会的规则,但是,严格限制同一篇论文进行检测将是未来发展的趋势。 www.turnitinuk.net
四、国外留学生写论文,经常翻译国内中文论文成其他语种,是否需要检测?反之,国内学生翻译国外论文成中文,也是否需要检测? 答:随着网络的普及,信息传播方式的变化,查阅学术资料越来便捷,许多人很轻易的查阅到国外的资料。但是因为语言障碍,许多检测系统检测到其他语种的论文,因此翻译外文论文成为写作论文的捷径。尽管如此,依然需要对翻译的论文进行检测。第一,相互抄袭太严重;第二,许多人都在翻译外文资料,无法确定在你之前是否有人翻译过,并被检测系统收录;第三、存在一稿多投现象,一个论文或许以多种语言的形式发表。形式最好转换成Reference list的形式,sci、ei以及其他英文论文严禁直接引用,直接引用容易造成重复率过高,最好转述后加引用,即使是常识性的内容页要加引用或者转述后加引用。
五、明明我复制了别人的内容,为什么检测之后重复率很低或者是0%? 答:任何一个系统都不能包罗万象,收录所有的文字,如果你复制的文字不在系统的数据库里,就会出现检测结果很低或者是0%的现象。
六、为什么我引用的内容也算重复? 引用的内容是否算在重复率内,不同的学校、老师的理念不一样,不算的话重复率低一些,但是如果学校或者老师算在内的话,而个人认为不算,最后学校出的重复率会很高。因此,谨慎起见,我们出的结果一般将引用也算在内,这样的话,就不会出现差距。如果你们学校、老师明确了引用不算,你可以直接忽略引用被标记为重复的内容,但是,目前的学术规范都不提倡直接引用,所以引用的内容最好转述一下,这样会很大程度上降低重复率。
七、重复率在什么范围内比较合适? 目前,没有一个很直观准确的标准来界定什么是重复、抄袭,包括检测报告也是仅供参考,5%-10%以下比较合适,20%以上要大量修改
八、毕业论文copy自己发表的论文,查重时算不算重复率?或者将毕业论文的某些部分抽出来发表算不算抄袭?或者将发表的中文论文翻译成其他语言再发表是否允许 答:在学术规范中,有自我剽窃的说法,就是将自己已发表的论文再次发表。在科研活动中,其核心的内容是创新,如果将已经发表的内容再次发表,是对已完结研究的重复复制,并未体现创新的精神。具体到上述情况,最好咨询本机构的学术权威和学术委员会,看是否对这方面的情况有规定 网友分享的方法: 1、如果是引用,在引用标号后,不要轻易使用句号,如果写了句号,句号后面的就是剽窃了(尽管自已认为是引用),所以,引用没有结束前,尽量使用分号。有些人将引用的上标放在了句号后面,这是不对的,应该在句号之前。
2、可以将文字转换为表格,将表格边框隐藏。
3、如果你看的外文的多,由外文自己翻译过来引用的,个人认为,不需要尾注,就可以当做自己的,因为查重的数据库只是字符的匹配,无法做到中文和英文的匹配。
4、查重是一个匹配的过程,是以句为单位,如果一句话重复了,就很容易判定重复了, 所以: 的确是经典的句子,就用上标的尾注的方式,在参考文献中表达出来,或者是用:原文章作者《名字》和引号的方式,将引用的内容框出来。引号内的东西,系统会识别为引用 如果是一般的引用,就采用罗嗦法,将原句中省略的主语、谓语、等等添加全,反正哪怕多一个字,就是胜利,也可以采用横刀法,将一些句子的成分,去除,用一些代词替代。或者是用洋鬼子法,将原文中的洋名,是中文的,就直接用英文,是英文的直接用中文,或是哦中文的全姓名,就用中文的名,如果是中文的名,就找齐了,替换成中文的姓名。 故意在一些缩写的英文边上,加上(注释)(画蛇添足法),总之,将每句话都可以变化一下,哪怕增加一个字或减少一个字,都是胜利了。 特别注意标点符号,变化变化,将英文的复合句,变成两个或多个单句,等等,自己灵活掌握。
因为真正写一篇论文,很罕见地都是自己的,几乎不可能,但大量引用别人的东西,说明你的综合能力强,你已经阅读了大量的资料,这就是一个过程,一个学习、总结的过程。 所有的一切,千万别在版面上让导师责难,这是最划不来的。导师最讨厌版面不规范的,因为他只负责内容,但又不忍心因为版面问题自己的弟子被轰出来。
5、下面这一条我傻妞试过的,决对牛B:将别人的文字和部分你自己的文字,选中,复制(成为块,长方形),另外在桌面建一个空文件,将内容,复制到文件中,存盘,关闭。将这个文件的图标选中,复制,在你的正文中的位置上,直接黏贴,就变成了图片了,不能编辑的。这个操作事实上是将内容的文件作为一个对象插入的,所以是图片。这个操作事实上是将内容的文件作为一个对象插入的。所以是图片。
以上那些东西再次总结一下:
查重是一个匹配的过程,是以句为单位,如果一句话重复了,就很容易判定重复了,所以:
1)如果的确是经典的句子,就用上标的尾注的方式,在参考文献中表达出来。
2)如果是一般的引用,就采用罗嗦法,将原句中省略的主语、谓语、等等添加全,反正哪怕多一个字,就是胜利。
3)也可以采用横刀法,将一些句子的成分,去除,用一些代词替代。
4)或者是用洋鬼子法,将原文中的洋名,是中文的,就直接用英文,是英文的直接用中文,或是中文的全姓名,就用中文的名,如果是中文的名,就找齐了,替换成中文的姓名。
5)故意在一些缩写的英文边上,加上(注释)(画蛇添足法),总之,将每句话都可以变化一下,哪怕增加一个字或减少一个字,都是胜利了。
6)如果是引用,在引用标号后,不要轻易使用句号,如果写了句号,句号后面的就是剽窃了(尽管自已认为是引用),所以,引用没有结束前,尽量使用分号。有些人将引用的上标放在了句号后面,这是不对的,应该在句号之前。
7)可以将文字转换为表格、表格基本是查重不了的,文字变成图形、表格变成图形,一目了然,绝对不会检查出是重复剽窃了。
快速通过论文查重的七大方法 方法一:外文文献翻译法 查阅研究领域外文文献,特别是高水平期刊的文献,比如Science,Nature,WaterRes等,将其中的理论讲解翻译成中文,放在自己的论文中。 优点:1、每个人语言习惯不同,翻译成的汉语必然不同。因此即使是同一段文字,不同人翻译了之后,也不会出现抄袭的情况。 2、外文文献的阅读,可以提升自身英语水平,拓展专业领域视野 缺点:英文不好特别是专业英文不好的同学实施起来比较费劲。
方法二:变化措辞法 将别人论文里的文字,或按照意思重写,或变换句式结构,更改主被动语态,或更换关键词,或通过增减。当然如果却属于经典名句,还是按照经典的方法加以引用。 优点:1.将文字修改之后,按照知网程序和算法,只要不出现连续13个字重复,以及关键词的重复,就不会被标红。2.对论文的每字每句都了如指掌,烂熟于心,答辩时亦会如鱼得水。 缺点:逐字逐句的改,费时费力。 方法三:google等翻译工具翻译法 将别人论文里的文字,用google翻译成英文,再翻译回来,句式和结构就会发生改变,再自行修改下语病后,即可顺利躲过查重。 优点:方便快捷,可以一大段一大段的修改。 缺点:有时候需要多翻译几遍,必须先由中文翻译成英文,再翻译成阿尔及利亚语,再翻译成中文。 方法四:转换图片法 将别人论文里的文字,截成图片,放在自己的论文里。因为知网查重系统目前只能查文字,而不能查图片和表格,因此可以躲过查重。 优点:比google翻译法更加方便快捷。 缺点:用顺手了容易出现整页都是图片的情况,会影响整个论文的字数统计。 方法五:插入文档法 将某些参考引用来的文字通过word文档的形式插入到论文中。 缺点:还没发现。 方法六:插入空格法(不一定能起作用) 将文章中所有的字间插入空格,然后将空 格 字 间距调到最小。因为查重的根据是以词为基础的,空格切断了词语,自然略过了查重系统。 优点:从查重系统的原理出发,可靠性高。 缺点:工作量极大,课可以考虑通过宏完成,但宏的编制需要研究。 方法七:自己原创 自己动手写论文,在写作时,要么不原文复制粘贴;要么正确的加上引用。增加大量的原创内容可以有效降低整体重复率。 优点:基本上绝对不会担心查重不通过,哪怕这个查重系统的阈值调的再低。 缺点:如果说优缺点的话,就是写完一篇毕业论文,可能会死掉更多的脑细胞。 方法八:错误法 将通顺的句子打乱顺序弄的不通顺,简练的句子,增加内容,使内容变的啰嗦,偶尔增加一些关键错别字,系统可能不能识别 优点:效果明显,词不达意 缺点:有可能被老师发现
|