惩罚好文章的AI检测,逼出一门灰色生意

AGI
AI开启的学术逆淘汰。

文 | 商业DNA

今年,全国越来越多高校将论文 AI 率的检测结果与答辩资格绑定,具体标准不一,从15%到40%不等。

至于检测结果从哪里来,准不准确,全是问号。同一篇论文换个平台检测,AI 率能差 20 个百分点。合格与不合格之间,或许只隔着一次平台选择。

为了过关,部分学生把学术论文改得口语化。电商和社交平台出现了“降 AI 率”服务,一个商家该项服务的累计销量就突破了 4000 件。

灰产只是小事,关键在于判断的标准。有学者指出:学术论文越规范、越严谨,越容易被判“像 AI”。因为高质量学术写作的特征,恰好就是大模型训练时偏好的优质语料特征。

当标准如此,系统惩罚的恰恰是那些认真写论文的人。

01 量不准的尺

国内某知名医科大学的研究生陈璐有个观察:自己用大白话写出来的毕业论文,AI 率并不高。

但班上的学霸,硕士课题发表在 SCI 杂志上、影响因子也很高,用同一个课题写出的毕业大论文,AI 率却高达 30%。

“他们都很无奈,就是因为写得太规范了。”陈璐说。

这不是孤例。媒体用同一篇测试文本在三个平台检测,知网给出 AI 率 90.2%,PaperPass 给出 95.77%,PaperYY 给出 69.2%,最高和最低相差超过 20 个百分点。

不同平台之间差 20 个百分点,意味着同一篇论文从一个平台换到另一个平台,结果可能从合格变成不能答辩。

学生论文检测数字浮动,经典作品的结果更令人瞠目。有网友把《滕王阁序》和《岳阳楼记》输入同类检测系统,AI率超过50%。王勃写的骈文,范仲淹写的名篇,在这套系统面前,和一个研究生熬夜码出来的论文一样可疑。

2025年,中国人民大学新闻学院副教授董晨宇,将团队耗时 3 年,追踪多个真实案例写成的论文提交至检测平台,被判定 AI 率高达 82.54%。而其中标红的“高度疑似 AI 生成”段落,恰好是他们最扎实的原创内容。

北京航空航天大学法学院教授裴炜给出了一个关键解释:多数 AI 率检测系统的原理是基于“语言预测”——分析大量 AI 生成文本,归纳出 AI 的语言习惯,再与学生论文进行比对。

但人类本来也会使用规范、重复的表达,尤其在学术写作这种高度格式化的领域。

“没有 AI,人也可能做出类似的语词联系和表达。”换句话说,检测系统不是在判断“是否 AI 生成”,而是在判断“是否像 AI 生成的文本”。

它没有能力区分站在屏幕前的,是一个写得规范的人,还是一台模仿规范的机器。

同济大学法学院互联网与人工智能法律研究中心主任张韬略直言,当前 AI 生成内容检测工具的技术成熟度存疑,若直接用于判定学生学术诚信,可能存在误判风险。

02 被逼出的灰色生意

当一个并不成熟的工具,拥有了学生毕业与否的能力,一切开始失控。

本科毕业生刘风总结出规律:越是逻辑清楚、用词规范,越容易被系统判定为 AI 生成;表达越随意、越口语,反而越容易过关。

她连续四五天对着检测报告改句子,“论文水平没多少精进,精力全耗在应付系统上”。

具体操作包括把然而改成但,把例如换成比如,把综上所述删掉。有人刻意加了的、啊、呢、哦之类语气词。还有人把句号改成逗号,AI 率居然就此降了 20 个百分点。

更离谱的策略是中英互译,把论文翻译成英文再译回中文,结果专业术语“肿瘤微环境”变成了“身体里的小坏蛋”。

学生的目的已经不再是写出好论文,而是向AI证明自己不是机器。当人需要证明自己是人,游戏规则就已经反了。

而规则正在催生出一条灰色产业链。

一款叫“写作狗”的系统,号称用 AI 技术对模板化句式做重组,可以将 AI 率从 95.77% 降至 11.3%。截至 6 月 10 日,该服务在淘宝已售出 4166 件,商家称"90% 的用户降完后都是 10% 左右"。

在社交平台上,"降手"们活跃起来。他们按字数收费,千字 10 元左右。主打"纯人工降 AI"。

《法治日报》的记者调查发现,人工只是号称,降手们靠的还是AI。打开 AI 工具,输入特定指令,"操作快的话,10 多分钟就能改完"。所谓的"降手",不过是会用 prompt 的中介。

传统论文代写需要人查资料、写文章,成本高、周期长;而降 AI 率的要低上很多,API 调用成本可能不到几毛钱,几分钟就能交货。也有学者认为,这门生意的利润空间,恐怕超过论文代写。

更值得注意的是,过去买代写的大多是少数不愿写论文的学生。但现在,大量自己认真写论文的学生,因为检测误判,也成了这门生意的被迫买单者。

媒体报道中,有人前后在维普做了 4 次 AIGC 检测、1 次查重,花了近 140 元,在同学中已属偏低。有人在知网反复检测降重花了约 750 元。

学生花钱检测,花钱降 AI 率,再把论文改烂。产业链的每一环都在赚钱,只有论文的质量在滑坡。

03 学术逆淘汰

过去几年,AI生成的内容越来越多,人们对此的应对也在不断变化。

2023 年 1 月,OpenAI 发布 AI 文本检测工具"AI Classifier",准确率仅 26%,同年 7 月宣布关闭。

2023 年,美国南佛罗里达大学邀请 72 名语言学专家区分 AI 文本和人类写作,正确率 39%。

2024 年初,福州大学、中国传媒大学等高校陆续发布毕业论文 AIGC 检测通知。

2025 年 5 月,南京大学明确:AIGC 检测结果仅作为学术规范性辅助参考,不作为论文原创性判定依据。

2026 年 5 月,中国学位与研究生教育学会发布《规范研究生学位论文与实践成果中人工智能工具使用指南》,重心从技术检测转向压实主体责任,强调使用声明、过程留痕和答辩质询。

这些反思和回调发生的同时,更多高校在加码。

有些学校已要求本科论文 AI 率不超过 15%,硕士不超过 10%,博士不超过 5%。福州大学规定:查重检测或 AIGC 检测第二次才通过的论文,最终总评成绩只能记作及格。

这意味着学生在跟一个误差高达 20% 的系统博弈。

江西师范大学政法学院颜三忠教授看来,“用 AI 检测 AI,再用 AI 改写欺骗检测”,这已经构成了一个封闭的荒诞循环。

学生不是在学习如何做研究,而是在学习如何在一套不可靠的规则下生存。

学生为通过检测刻意“降 AI 率”,本质上是被迫对抗技术缺陷,反而降低了论文质量。

上海财经大学特聘教授胡延平说得更尖锐:“如果有毕业生用 AI 解决了某个重大问题,哪怕 AI 率高达 90%,也应该给他奖励。如果有人堆砌出了 AI 含量为零、但实际价值也为零的文章,即使给他发表空间也是资源浪费。”

几年前,OpenAI 已经因为检测准确率过低关闭了自己的检测工具,72 位语言学专家也分不清人和 AI。今天,AI却有了决定学生能否毕业的权力。

这套系统里,一天卖出几千单的降AI服务,反而是问题最少的环节。

(文中人物皆为化名。)

本文系作者 商业DNA 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App