惩罚好文章的AI检测，逼出一门灰色生意-钛媒体官方网站

文 | 商业DNA

今年，全国越来越多高校将论文 AI 率的检测结果与答辩资格绑定，具体标准不一，从15%到40%不等。

至于检测结果从哪里来，准不准确，全是问号。同一篇论文换个平台检测，AI 率能差 20 个百分点。合格与不合格之间，或许只隔着一次平台选择。

为了过关，部分学生把学术论文改得口语化。电商和社交平台出现了“降 AI 率”服务，一个商家该项服务的累计销量就突破了 4000 件。

灰产只是小事，关键在于判断的标准。有学者指出：学术论文越规范、越严谨，越容易被判“像 AI”。因为高质量学术写作的特征，恰好就是大模型训练时偏好的优质语料特征。

当标准如此，系统惩罚的恰恰是那些认真写论文的人。

01 量不准的尺

国内某知名医科大学的研究生陈璐有个观察：自己用大白话写出来的毕业论文，AI 率并不高。

但班上的学霸，硕士课题发表在 SCI 杂志上、影响因子也很高，用同一个课题写出的毕业大论文，AI 率却高达 30%。

“他们都很无奈，就是因为写得太规范了。”陈璐说。

这不是孤例。媒体用同一篇测试文本在三个平台检测，知网给出 AI 率 90.2%，PaperPass 给出 95.77%，PaperYY 给出 69.2%，最高和最低相差超过 20 个百分点。

不同平台之间差 20 个百分点，意味着同一篇论文从一个平台换到另一个平台，结果可能从合格变成不能答辩。

学生论文检测数字浮动，经典作品的结果更令人瞠目。有网友把《滕王阁序》和《岳阳楼记》输入同类检测系统，AI率超过50%。王勃写的骈文，范仲淹写的名篇，在这套系统面前，和一个研究生熬夜码出来的论文一样可疑。

2025年，中国人民大学新闻学院副教授董晨宇，将团队耗时 3 年，追踪多个真实案例写成的论文提交至检测平台，被判定 AI 率高达 82.54%。而其中标红的“高度疑似 AI 生成”段落，恰好是他们最扎实的原创内容。

北京航空航天大学法学院教授裴炜给出了一个关键解释：多数 AI 率检测系统的原理是基于“语言预测”——分析大量 AI 生成文本，归纳出 AI 的语言习惯，再与学生论文进行比对。

但人类本来也会使用规范、重复的表达，尤其在学术写作这种高度格式化的领域。

“没有 AI，人也可能做出类似的语词联系和表达。”换句话说，检测系统不是在判断“是否 AI 生成”，而是在判断“是否像 AI 生成的文本”。

它没有能力区分站在屏幕前的，是一个写得规范的人，还是一台模仿规范的机器。

同济大学法学院互联网与人工智能法律研究中心主任张韬略直言，当前 AI 生成内容检测工具的技术成熟度存疑，若直接用于判定学生学术诚信，可能存在误判风险。

02 被逼出的灰色生意

当一个并不成熟的工具，拥有了学生毕业与否的能力，一切开始失控。

本科毕业生刘风总结出规律：越是逻辑清楚、用词规范，越容易被系统判定为 AI 生成；表达越随意、越口语，反而越容易过关。

她连续四五天对着检测报告改句子，“论文水平没多少精进，精力全耗在应付系统上”。

具体操作包括把然而改成但，把例如换成比如，把综上所述删掉。有人刻意加了的、啊、呢、哦之类语气词。还有人把句号改成逗号，AI 率居然就此降了 20 个百分点。

更离谱的策略是中英互译，把论文翻译成英文再译回中文，结果专业术语“肿瘤微环境”变成了“身体里的小坏蛋”。

学生的目的已经不再是写出好论文，而是向AI证明自己不是机器。当人需要证明自己是人，游戏规则就已经反了。

而规则正在催生出一条灰色产业链。

一款叫“写作狗”的系统，号称用 AI 技术对模板化句式做重组，可以将 AI 率从 95.77% 降至 11.3%。截至 6 月 10 日，该服务在淘宝已售出 4166 件，商家称"90% 的用户降完后都是 10% 左右"。

在社交平台上，"降手"们活跃起来。他们按字数收费，千字 10 元左右。主打"纯人工降 AI"。

《法治日报》的记者调查发现，人工只是号称，降手们靠的还是AI。打开 AI 工具，输入特定指令，"操作快的话，10 多分钟就能改完"。所谓的"降手"，不过是会用 prompt 的中介。

传统论文代写需要人查资料、写文章，成本高、周期长；而降 AI 率的要低上很多，API 调用成本可能不到几毛钱，几分钟就能交货。也有学者认为，这门生意的利润空间，恐怕超过论文代写。

更值得注意的是，过去买代写的大多是少数不愿写论文的学生。但现在，大量自己认真写论文的学生，因为检测误判，也成了这门生意的被迫买单者。

媒体报道中，有人前后在维普做了 4 次 AIGC 检测、1 次查重，花了近 140 元，在同学中已属偏低。有人在知网反复检测降重花了约 750 元。

学生花钱检测，花钱降 AI 率，再把论文改烂。产业链的每一环都在赚钱，只有论文的质量在滑坡。

03 学术逆淘汰

过去几年，AI生成的内容越来越多，人们对此的应对也在不断变化。

2023 年 1 月，OpenAI 发布 AI 文本检测工具"AI Classifier"，准确率仅 26%，同年 7 月宣布关闭。

2023 年，美国南佛罗里达大学邀请 72 名语言学专家区分 AI 文本和人类写作，正确率 39%。

2024 年初，福州大学、中国传媒大学等高校陆续发布毕业论文 AIGC 检测通知。

2025 年 5 月，南京大学明确：AIGC 检测结果仅作为学术规范性辅助参考，不作为论文原创性判定依据。

2026 年 5 月，中国学位与研究生教育学会发布《规范研究生学位论文与实践成果中人工智能工具使用指南》，重心从技术检测转向压实主体责任，强调使用声明、过程留痕和答辩质询。

这些反思和回调发生的同时，更多高校在加码。

有些学校已要求本科论文 AI 率不超过 15%，硕士不超过 10%，博士不超过 5%。福州大学规定：查重检测或 AIGC 检测第二次才通过的论文，最终总评成绩只能记作及格。

这意味着学生在跟一个误差高达 20% 的系统博弈。

江西师范大学政法学院颜三忠教授看来，“用 AI 检测 AI，再用 AI 改写欺骗检测”，这已经构成了一个封闭的荒诞循环。

学生不是在学习如何做研究，而是在学习如何在一套不可靠的规则下生存。

学生为通过检测刻意“降 AI 率”，本质上是被迫对抗技术缺陷，反而降低了论文质量。

上海财经大学特聘教授胡延平说得更尖锐：“如果有毕业生用 AI 解决了某个重大问题，哪怕 AI 率高达 90%，也应该给他奖励。如果有人堆砌出了 AI 含量为零、但实际价值也为零的文章，即使给他发表空间也是资源浪费。”

几年前，OpenAI 已经因为检测准确率过低关闭了自己的检测工具，72 位语言学专家也分不清人和 AI。今天，AI却有了决定学生能否毕业的权力。

这套系统里，一天卖出几千单的降AI服务，反而是问题最少的环节。

（文中人物皆为化名。）