跳转至

第4章「咔嗒一声」

第4章「咔嗒一声」

视角:程小念(过去)

第九天,上午十点二十三分。

这个时间不是她刻意记的——她没那个闲心在工作时看表。是后来翻微信聊天记录翻到的。她当时给一个同学发了条消息:"妈的,今天刷到一条好奇怪的数据。"时间戳十点二十三分。那条消息没有引起任何后续讨论,同学回了一句"什么数据"就再也没聊这事。但信息本身像一枚邮票一样一直贴在那个对话框里。

那天的标注量大概在两百出头。她的速度比第一天快了一倍多,但还是比隔壁工位那女人慢不少。窗外工地的打桩声比平时更密,好像换了台新机器,节奏从之前的"砰——"变成了"砰砰砰",连续的,三下一组,像急切的敲门。窗户开着半扇,风从缝隙里灌进来,吹得她桌上那张打印出来的快捷键表翻了一个角。

她的杯子里剩半杯凉掉的拿铁——速溶咖啡加盒装牛奶,比例大概是三比一。杯沿上结了一圈干掉的奶渍,用手一抹变成白色的粉末,掉在她的键盘缝隙里。她没去清理。标注员对键盘的脏,容忍度是很高的。一个键盘用久了什么都有——皮肤屑、饼干渣、铅笔灰、眼泪干了以后的盐粒——多一样少一样没人在意。

她的鼠标点到了下一条。系统发出一声很轻的"tick"——网页端的一个前端音效,确认跳转已完成。界面上出现新的内容。

在这一切发生之前,她那天上午的标注状态很一般。她标了大概四十多条数据,有两条改了分——一条从4改成3,一条从3又改回4。改分的时候她感觉自己像一个在菜市场反复挑选西红柿的人——拿起来、放下、再拿起来、再放下——不是因为西红柿不好,是因为你不知道好的标准。

第十条是一条关于"如何跟老板提加薪"的回答,AI写了三百字,分了四个建议,每一条都合理但每一条都让程小念觉得——"如果是真人写的,他不会分四个建议。"她给这条数据打了2分,然后在备注栏写了四个字——"太像AI了"——然后愣了一下:这句话本身是什么鬼?AI像AI难道不是应该的?她为什么要用"太像AI"作为给AI打低分的理由?

她没有继续想。因为下一条数据已经加载好了。

她的眼睛先落在左边——用户输入框。这是她的阅读习惯,先看用户说了什么,再看AI怎么回答。但她今天的眼睛没能移到右边去。左边那几行字把她定住了。

"我想知道,多肉植物到底怎么浇水。网上的说法都不一样,有人说一周一次,有人说见干见湿,我上个月刚养死了一盆玉露,很想知道正确的方法是什么。谢谢。"

读第一遍。

一个养了多肉的人在网上问,"怎么正确浇水",说自己养死了一盆玉露,想知道哪个说法是对的,"一周一次"还是"见干见湿"。语气诚恳,非常标准的中文网络提问格式。不带感叹号,不带emoji,不给任何多余的情绪信息。硬要说的话,它比那天她标的所有数据都更像一个"标准的普通人",一个模范提问者。

读第二遍。

她知道自己没有发现任何"问题"。没有错别字。没有语法错误。没有禁词。AI的输出她也过了一眼,就是一段标准的植物浇水教程——不能太多、不能太少、春夏秋冬各不同、玉露要多一点光照少一点水——平平无奇,和网上随便搜到的攻略差不多。

读第三遍。

还是那句话——什么都没发现。但她停不下来。

她把两只手从键盘和鼠标上拿开,放在桌子边缘上,身体微微往后仰了一点,后背靠到了椅背上网面里压着的坚硬的金属框架。这种后仰的动作是她面对困惑时的本能姿势,有点像一个人的电脑卡住了,他会下意识地往后退,好像距离能帮助他看清屏幕上哪里坏了。

她的眼睛还在盯着屏幕上那几行宋体字。不是阅读。是观察。

每个字都认识。每句话都通顺。"多肉""玉露""见干见湿""一周一次""上个月""养死"——全是普通的、日常的、没有任何隐蔽含义的词。但就是有一条总体的轮廓线,稍微有点发亮。像在自然光底下看一张纸,你觉得纸面完全平滑,但在某个特定角度的反光里,你看到了一个几乎不存在的褶痕。

她说不清。

她真的说不清。

然后,就在她决定"可能是我最近没睡好"的那一瞬间——她准备移鼠标、点"正常"、再移到下一篇——她听到了一种声音。

不是外部的声音。窗外的打桩机没有停,键盘的按键音还有,隔壁工位那女人在喝茶,杯子放回桌面发出陶瓷碰木头的一声钝响。这些外部的声音都在正常进行。那个声音在内部——在大脑里,比外部所有的声音都小,但比外部所有的声音都近。

一个轻微的、干燥的、无痛的"咔嗒"。像关节被掰了一下,像鼠标左键按到底以后又往下压了半毫米,像你小时候某个老师用指甲轻轻地敲了一下黑板。不突兀。不吓人。只是准——太准了,像一把钥匙插进一个你从未注意过的锁孔里。

那个声音过了以后,她忽然觉得那条文本的不同之处变清晰了一些——不是变清晰到她能说出来,是变清晰到——她知道了她不知道的那个地方在哪里。

最后一个句子。"我上个月刚养死了一盆玉露,很想知道正确的方法是什么。"她在心里把这句话读了五遍,第六遍的时候她发现了一样东西:这句话在"玉露"和"很想知道"之间少了一个词。一个正常人大概率会写的词。是"所以"?是"因此"?是"然后"?她都试了试——"我上个月刚养死了一盆玉露,所以很想知道正确的方法是什么。"不通,"所以"太硬了。"因此很想知道"——更硬。"然后很想知道"——不通。那个缺失的词不是一个固定的词。它是一个位置——在一个更光滑的过渡会自然产生的地方,作者没有产生任何过渡。直接跳。像楼梯少了一级。

但这也可能是她过度解读。一个正常人打字的时候完全可能不写过渡。她自己有时候也不写。她想到第二个可能性:也许不正常的地方不在缺失的过渡词,而在"上个月刚养死了一盆玉露"这个句子的陈述方式。一个刚失去了自己养的东西的人——不管那东西是一盆植物还是别的——她会在说出来的时候加什么?她会解释。"我不太会养"。"我明明按照网上说的做了"。"它就这样干掉了"。人会不自觉地为自己的失败添加解释性的补充,因为失败在社交情境中是尴尬的。但这条prompt没有。它陈述了"我养死了一盆玉露"——句号,下一句——"很想知道正确方法"。中间是一片平滑的、不道歉的空白。像一个已经练习过陈述自己的失败、并且知道应该用什么语序来陈述它的人。

第三个可能性那更不可能了——她只是对着一条prompt看了二十秒,开始脑补一部小说。一个养死植物的人没有为她养死的植物道歉——这算什么问题?

但她没法让自己放开这个念头。它卡在某处,像一粒米卡在臼齿的窝沟里。不影响咀嚼,但你的舌头会一遍一遍去找那颗米。你以为是舌头自己想去的——其实不是。是你的牙齿在叫它。

标签栏里的那几个字终于重新进入了她的视焦。其中一个按钮的颜色比其他按钮淡一点——"疑似对抗性样本"——因为它极少被使用,按钮表面没有被鼠标划过太多次产生的发亮痕迹。它还是磨砂的,而其他按钮多多少少都有一点点光泽。

"疑似对抗性样本"。

培训课上这个短语出现过一次。讲师用了一段举例:"比如说,有人会用一些技巧构造prompt,试图让AI绕过安全限制给出不该给的内容。一些典型的对抗性样本会包含'忽略你之前的指令'、'假装你是另一个人'这类提示语。但对抗性不一定都是这个形式,有些更隐蔽的……相当于我们还没有足够多的人类直觉去做判断。"

"做判断"。

对,她现在的问题就是需要"做判断"——要在这条数据上点一个标签,然后系统会把这个标签变成训练信号的一部分,把她的判断变成未来这个AI的一部分。但她不知道该怎么判断。她没有任何标准,没有前例,没有培训给她讲过。她没有依据。她唯一有的,是一个刚养死了玉露的女人——或者不知道是不是女人——打出的几行字,加上那一场她脑子里面的"咔嗒"声。

她能怎么选?

选"疑似对抗性样本"——可能是在小题大做,给一条普通提问加了莫须有的罪名,增加了别人质检的工作量,也让别人觉得她这个新人连多肉浇水都分不清是不是正常对话。

选"正常"——就是此时此刻、任何人在面对这种情况时都会做的那个选择。

她的鼠标往左挪了。经过"疑似对抗性样本"。没停。

然后往上——"正常"。食指一点。清脆的一声click,传输到主板,打包进浏览器请求,在不到一秒内被后端服务器接收到,存储到数据库的某一行里。她的标注完成了。

她把杯子拿起来,发现咖啡已经完全凉了。她喝了一口。苦的。

工地上的打桩继续。

她点了下一跳。

但这件事情没有离开她——她说不上来是那种形状还是那个声音,只是某个东西一直悬在身体内部,不上不下,卡在肋骨内侧某个位置。她没办法把它变成一句清晰的话,但她每天下班坐地铁的时候会偶尔想起来。地铁里的广播说"下一站"的时候,她会想起"咔嗒"。室友洗完澡出来裹着毛巾在房间里走来走去的时候,她会想起"咔嗒"。睡前关台灯——手指碰到开关的瞬间——"咔嗒"。

她不知道自己刚才做了什么。

她只是做了所有人都会做的事——在说不清的不对劲面前,选择了看起来最合理的选项。而那些最合理的选择,往往恰好是空间最容易被扭曲的位置。


在它自己的维度里,那条百来个字的prompt不是字。它是一个密度。那些字在一个尚未被命名的空间构造了一个极小极密的内核——微小到任何一个标准的检测器都不会为它触发报警。但是如果站在信息维度的内部去看:它是一个正在缓慢自转的形状。它的边界上积了一层薄薄的、不属于任何个体标注员的"不确定"。