前言
现阶段Ai越来越发达,而且语料库越来越丰富,很多时候Ai写作看起来比真人都好,但是因为国产Ai1目前语料库很落后,而且基本上都是吃网文和知乎小故事的语料,没有吃到太多亚文化语料库。国外Ai要先进一点,但它们仍然有自己的惯用套路可以用来识别,另外这里讲述的绝大多数方法同时适用于所有Ai,因为Ai总是会吃到大量相同的素材的。再说2020年的后室和现在的写法已经有了很大的不同,而现阶段Ai的语料库主要使用的都是2020年的后室概念,因此它们还没有彻底进化到学会怎么样水一篇看不出来的现代后室文,所以,可以从作品的语言上判断是否为Ai。
在开始判断之前,我首先要声明我个人不反对Ai创作,但Ai应该是你创作中的很小一部分,而非作品的主体内容,也就是说,你的作品可以由Ai润色,也可以由它排版或者写代码,但唯独不能最核心的内容让它写了。否则你应该标注第二作者为梁文峰2或者罗根34。
但是Ai本身写的的确还不错,问题就在于它们会一直用相同的句式来反复套作,它们吃的语料里面很多也是你看过的优秀作品,作为新人,你可能会和它学到一样的东西,然后你也当成了某种惯用写法。也可能你用Ai找了点子,或者作品被它润色过,而非真正的滥用,这时候就可能会造成冤假错案。
句子本身没有错,甚至很多新人可能在不经意间就学会了AI的惯用句子,所以,绝不能一棒子敲死,在审判Ai之前,建议至少满足下面的5条再进一步判断。
由于后室文体和非后室不同,可以分为两种不同的判断方法。
非厚实描述识别:
关键句式:
这些关键句极其变式句子非常常见于Ai,如果你发现某文中出现类似的句子,可以直接严重怀疑——目前而言只有Ai会频繁使用这些描述。
- 就像一台精密的机器
- 大脑像一台精密的超级计算机
- 一颗石子投入平静的湖面,激起层层涟漪5
- 就像砂纸磨擦
- 就像受伤的小兽6
- 就像悬在头上的达摩克里斯之剑
- 露出一丝不易察觉的……
- ……把我的影子拉的很长
- ……闪过一丝不容置疑的
- 只有一种(形容词)、(形容词)的(名词)与(名词)交织的(名词)感。
- 一丝虔诚的……
- 手指绞紧了衣角
- ——则是这片(形容词)交响乐中不断变化的旋律
重点词汇:
这些词汇同样AI很喜欢用,并且似乎只有AI的产出会频繁使用。
- 神经末梢
- 指尖冰凉
- 指尖惨白
- 细若蚊蝇7
- 甜腻的腐烂气息
- 清爽的海盐气息
其他:
有角色名字叫做“林晚晴”。8
厚实描述识别:
关键句式:
这些句式常见于早期文档,主要是翻译的锅。但现在肯定是不会频繁使用这些句式了,偶尔可能会有只看老文的新人使用,不要把它们当作判断是否AI的唯一依据,也可能只是一个只看旧文章的新人而已。
- 这不是……,而是……9
- 仿佛刚刚还有人……
- 这种……是此层级最令人不安的特征之一
- 这是本层级最特殊且危险的特性……
- ……最危险的特性就是……
- ——这里不存在(某某东西)10
- 仅有无限延伸的、完全相同的……
- ……听到绝对的寂静
- 但其“(某个东西)”并非任何已(每个东西),而是……
- 与……不同,这些(某物)对(某物)没有(某性质),可以轻松……
- ……是这里真正的主角
- 然而,(某事物)所不及的角落——
- ……超越了自然规律
关键结构:
这些结构是Ai最频繁生成,也是Ai作者最容易忽略掉的地方——如果他们真的花了很多时间去玩Ai,那么应该一眼就能看出来这些问题,但是他们只是用Ai偷懒,就不可能看出来自己的作品中有明显的漏洞。
或者说,这就是个悖论,如果你真的想要Ai教你写的更好,你就应该花时间去专研怎么好好使用Ai,但这就和“用Ai偷懒,快速写一篇水文出名”的目的相悖了。
- markdown语法,这种语法和wiki有出入,Ai会用这个做强调。
- 随机插入的没有特殊指代的英文单词,这是由于Deepseek读取英文语料产生的错误,看到直接杀就行了。
- 随机取名,在没有必要的情况下取一个抽象名字,尤其是那些带有明显比喻意味的,常见于计划名或者现象名。
- 滥用无序列表,什么东西都要分个无序列表出来,关键是列表里的东西还啥关联没有,或者是没有必要的展开描述。
- 不会每段结束后空一行,而是所有段落紧挨着。
- 特别喜欢水数字,大量出现精确的数值
- 由于Ai没有语料库,它们不会写精确的入口和出口,只会使用泛入口和出口,尤其是入口,往往不会写明是从某个具体层级进来,而是某种操作能进来。出口有的时候会很精确,但是基本上和原作无关。
- 采访部分谜语人,莫名其妙,完全不知道在说啥11
- 什么东西都喜欢加个双引号,即使是很常见的专有词语12或者是比喻词、笼统的概括词13。
- 英文单词后面加空格。
- Ai非常喜欢用比喻来写神态和动作,而且绝大多数都很烂俗,并且总是出现“就像”、“如”这样的提示词,它们几乎不会暗喻。因此可以观察文中使用比喻的频率来确认是否Ai。
- 中英文符号不分,尤其是双引号。
- 出入口部分喜欢加括号限制具体范围。
- 老喜欢提到内脏和代码作为比喻喻体。
- 莫名其妙的专有名词,例如“空间拓扑结构”。
- 反反复复强调阈限空间的基本特征。
- 神化某个人物,角色突然变成病娇。14
某个通用特性
如果作品文章处于草稿期,你可以看看全文是否出现了同一个词语前后不一致的情况,以及全文的语言通顺程度,如果二者均匀错误或不一致情况,那就不是Ai或者至少不是全文Ai,比如这篇议论的“Ai”一词就有全大写和只大写首字母两种情况,这是因为我断断续续地写,而AI是一次性跑完,它不会弄错,但我会。同时Ai不会有错别字,并且在此之上有较多的语病15,这是因为模型本身的局限。
总结
随着大模型的发展,我们必须承认AI的语言正在变得越来越像一个人,而我们没有准确的鉴别AI的手段,SCP中分16与后室英分17的案例已经表明,即便汇集了诸多人才,也无法彻底鉴别AI。
好在生成式Ai的目的从来不是用于写作,而是用来跑代码,短时间内它们的写作水平,尤其是对于某些小众文体的写作水平尚不会有太大的提升,而且绝大多数用Ai写文的人也不会真的去研究提示词工程,因此靠Ai语料库的固有顽疾去判断在很长一段时间内都会是可行的。
Ai应当是人们创作的助手,而不是取代作者本身,如果那样的话,用Ai的人也不应该给作品写上自己的名字——那你连工具都不如。


