英文AI检测报告解读

英文作业/论文一般使用turnitin进行AI检测,国外认可的是这个系统的AI结果,如果自己的学校要求用zeroGPT,那就用zeroGPT测,以学校要求用的检测系统为准,zeroGPT测出来的结果一般偏高,而turnitin系统测的AI结果更为准确(人性化)

Turnitin在美国、英国、加拿大、澳洲、香港等大学被用来检测essay和毕业论文。

目前,比较权威的英文AI检测系统有turnitin和iThenticate,这2个系统不仅可以查重,还可以进行AI检测,是国外认可的AI检测系统

(注:目前iThenticate 2.0版本才有AI)。

今天主要对AI报告进行解读。

先对比这2个系统的AI结果,后面会对AI报告进行解读。

一、iThenticate和turnitin测出来的AI结果相差大吗?

答案是:AI结果一样

(不仅AI结果一样,查重结果也基本相似,注:仅仅是这篇查重结果相似,不代表所以的文章都一样哈)

测试结果如下:结果都是73%,下图是在iThenticate和turnitin官网页面的截图,而虽然turnitin没有看到logo,但下载后的PDF报告是有turnitin的logo的,不说的话,还以为是一个系统测的。

iThenticate 2.0版本AI检测结果
turnitin的AI检测结果

下面是iThenticate和turnitin的AI检测报告( PDF版)对比一下。除了logo,重复的地方和基本格式内容都一样的。


为什么iThenticate和turnitin的AI结果一样?最简单解释就是:iThenticate是turnitin公司的一款查重产品,主要面向学术期刊检测的。所以iThenticate的AI技术是turnitin公司赋予的,turnitin和iThenticate是一家公司的。

(那需要查英文AI的同学选哪个查都可以,问题不大的)


三、AI报告解读

①AI检测指标中的百分比数值是什么意思?(比如下图的73%)

The percentage indicates the combined amount of likely AI-generated text as well as likely AI-generated text that was also likely AI-paraphrased.

百分比数值(73%)表示文章中有多少比例的内容可能是由 AI 写的,或者由 AI 写完再用 AI 改写的。

②AI检测报告中蓝色或紫色代表什么意思?

如果标记了蓝色:可能是由大型语言模型生成的文本。”换句话说,就是系统判断这段文字很有可能是像 ChatGPT这样的 AI 生成的。

如果标记了紫色:可能是由 AI 生成的文本,并可能经过 AI 改写工具或词语替换工具的修改

换句话说就是这段文字不仅可能是 AI 写出来的,还可能被另一个 AI 工具进行了同义词替换或重写处理。


③AI内容检测率具体数值,只显示星号“*%”是什么?

AI detection includes the possibility of false positives. Although some text in this submission is likely AI generated, scores below the 20% threshold are not surfaced because they have a higher likelihood of false positives.

AI 检测可能会出现误报。虽然本次提交中部分文本可能是由 AI 生成的,但由于分数低于 20% 的阈值,更容易出现误判,因此不会被标记出来。

意思是:即使系统检测到一些内容可能是 AI 写的,如果这个比例不到 20%,系统一般不会提醒你,因为误判的可能性比较大。(有一定程度的AI内容,但又不能完全确定,所以就用星号显示。学校老师和出版社编辑看到星号,大部分情况下就是默认该篇文章通过了AI检测。

系统如此设置星号*%是为了避免“误伤”
1)避免误伤人类书写内容:AI 模型可能会误判人类写作内容为 AI 生成内容

尤其是AI 检测分数低于 20% 的情况,更容易出现误判。

因此,新报告中不会显示低于 20% 的分数或标记,只用星号 (*%) 表示,以减少误解。

在进行AI内容判断的时候会有一定概率将人类写的内容误判为AI内容,这对作者和正常的审稿秩序是有很大影响的。所以为了将误报率降到1%以下,官方系统设置了15%的缓冲空间,也就是说如果论文最终检测出AI内容率为50%,其实实际上的AI内容率可能是65%。
2)避免误伤AI润色内容:对于AI润色的内容期刊是不排斥的,因为AI润色只是修改了语言表达的方式,并不会影响科研成果内容的真实性,但是这部分润色的内容比人工撰写的内容更容易被判定为AI内容,虽然在检测系统中对AI润色和AI生成进行了区分,但不可避免还会存在误判的情况,所以将AI内容率的阈值提升到了 20%,即论文中AI内容率低于20%的时候不认为文章中存在AI内容,内容率用星号“*%”标识。

④AI检测结果显示0%是指什么?

0%即代表系统没有检测到文件中包含任何AI生成的“符合条件文本”。

⑤AI检测结果不显示百分比,只有灰色的2个杠(--)表示什么

灰色且不显示任何百分比(- -)表示AI写作检测指示器无法处理该文档,这意味着无法打开 AI 写作报告(没有AI报告)。可能是该文档不满足AI写作检测的文件要求:
文件大小必须小于10 MB;
文件必须至少包含300个单词的长篇散文;
文件不得超过30000字;
文件必须用英文书写。


更多AI检测问题可以看下turnitin官网公布的内容:https://guides.turnitin.com/hc/en-us/articles/28477544839821-Turnitin-s-AI-writing-detection-capabilities-FAQs