第1章「程小念,一百八一天」
第1章「程小念,一百八一天」¶
视角:程小念(现在)
地铁2号线的车厢里挤满了人。六点半的晚高峰,每个人都在同时做两件事:站住和看手机。她站在靠门的位置,左手抓着吊环,那个吊环不知道被多少人握过,表面有一种光滑的黏腻,像摸到超市塑料袋的内侧。她用两根手指捏着它,其余三根手指悬空,用一个别扭但体面的姿势保持平衡。
右手刷手机。朋友圈在排队显示——大学同学晒了新公司的工牌,"AI赛道,未来可期",点赞的人名排了两行。她划过去,又划回来,犹豫了一下,没点。手指往下滑。学妹在卖保险,"给自己一份确定的未来"。再往下。前同事在晒加班餐,赛百味六寸三明治加一杯美式,配文"又肝了一个版本"。
她全都划过去,什么都没点。这种刷法不是为了看内容,是为了让时间有一个形状——把通勤的三十五分钟切成一块一块的,每块三十秒,吃完一块就切下一块。
车厢中间的电子屏开始播广告。她没抬头,但声音是必然会灌进来的——地铁的声场设计就是这样,你往哪儿躲都能听见。一个温柔的、略带金属感的女声在说:"让每一次对话都更懂你。"然后是演示画面:一个年轻女人对着手机说"帮我写一封辞职信",屏幕上的AI打字速度比任何人都快,两百个字符两秒出完,段落整齐,措辞得体,像一台已经在脑子里准备好了所有人类需求的机器。画面上跳出四个字:自然流畅。
车厢里有人抬了一下头,又低下去。
她抬了头。不知道为什么,但她抬了头。
屏幕上在播一段动画——无数光点从四面八方汇入一个发亮的球体,像银河系倒着旋转,光点是银白色的,拖着一小段残影,汇入的瞬间安静无声。配文:"超过万亿次对话训练,成就更自然的交流。"
广告右下角有一个logo。她看了一眼,没看清——车厢晃了一下,她身体跟着晃,吊环发出"吱嘎"一声,那个logo被晃出了她的视焦点。等她稳住,屏幕已经切到了下一个广告:某款保健品,中年男人举着盒子微笑,牙齿白得不真实。
她把手机揣回兜里。
那天下车以后她走了一段路才到家。四环边的公寓,一室一厅,月租三千八。她打开门,踢掉鞋子,把包扔在床上,去厨房倒了一杯水。水是早上烧的,这时候已经凉了。她站在厨房里喝完了整杯水,杯子放在水槽边上,然后走进卧室,在床沿坐了很久。
她没有开灯。窗外有路灯的光透过百叶窗照进来,在天花板上打出一条一条平行的光带。远处有车开过的声音,轮胎轧过路面接缝的时候发出有节奏的"咯噔、咯噔、咯噔"。她的手机屏幕自动亮了一下,是App推送——"你的外卖红包即将过期"。
她盯着那条通知看了五秒,然后把手机翻过去。
她脑子里在循环一段记忆。不是完整的——是碎片。一个女人声音说"让每一次对话都更懂你"。一栋老写字楼的四层。楼梯间的气味——烟味和潮湿和印刷品的墨味混在一起。那个气味她现在还能翻出来,像翻一本书的某一页。
大三下学期,四月中旬。她投了二十几份简历,面了三家,三家都没回音。每天刷新邮箱像买彩票——手指按下去的那一瞬间总有一种不理智的期待,明知不会有新邮件,但还是期待。然后看到收件箱零,胃里有什么东西往下坠一下。不是天塌下来的坠,是像坐电梯刚启动时的那种,很轻,很短,但你知道自己在往下。
一个同学在微信上找她。"有个兼职,日结,一百八一天,会打字就行,来不来?"
一百八一天。她算了一下——一个月去掉周末差不多四千块,比她爸妈每月给的一千五生活费多出一大截。她那个时候缺钱不是活不下去的那种缺,是逛超市拿起一瓶二十块的洗发水会犹豫五秒、最后放回去换成十块的那种缺。逛淘宝加进购物车的东西攒了四十几件,每一件都在三十块以内,但她一件都没下单。
她说来。
面试那天她穿了一件白色T恤和深蓝色牛仔裤,背帆布包,里面装了一瓶水、一包纸巾、一份简历。那份简历她来回改了五遍,最后一版在"社会实践"那一栏写了"无"——她想了很久要不要填点什么,比如学生会或者社团,但她在学生会只待了一个学期,做的事情是每次开会搬桌子。她觉得这不算社会实践,空着又不甘心,于是把字号调小了一点,让那行字的存在感降到最低。
去的路很远。地铁坐到终点站,出来还要走一公里。四月的风很大,这一带正在开发,路边全是蓝色围挡和裸露的泥土。围挡上的铁皮被风吹得哗啦哗啦响,有两块之间没对齐,露出一个缝,能看到里面正在挖的地基——一个巨大的土坑,坑底有几台挖机,黄色的,远远看去像几只昆虫在缓慢移动。
有几栋玻璃大楼已经盖好了,玻璃幕墙反射着太阳光,明晃晃的让人睁不开眼。但更多的是半成品的钢筋混凝土框架——黑色的骨架在天空下站着,上面挂着绿色的防护网,像没穿上衣的人裹了一身蚊帐。
那栋老写字楼夹在两栋新楼之间。
外墙贴着大理石纹的瓷砖,六十年代那种风格,四角的灰色已经泛黄。有几块瓷砖脱落了,露出底下灰色的水泥,脱落的断面参差不齐,像被人掰开的饼干。楼下保安亭是空的,玻璃上贴着一张A4纸,上面打印了三号黑体字——"访客请登记"——旁边放在一个登记本和一支没盖的圆珠笔。她翻开登记本,上一行登记时间是两周前。她随便写了个名字和手机号,推了一下玻璃门。门没锁,铰链发出一声拖长的呻吟。
大厅的灯管有两根不亮,另外两根在跳。不是闪烁,是"跳"——亮度和色温在微微浮动,像在呼吸,但呼吸的频率不太对,忽快忽慢。电梯门口放着一块黄色警示牌:"维修中,请走楼梯"。警示牌是塑料的,边角磕掉了一块,露出里面的白色。
楼梯间很窄,只能容一个人过。每层拐角都贴满了广告。考研辅导——"名师一对一,不过退费",广告上的名师都是同一个模版:中年男性、戴眼镜、双手交叉放在胸前、身后是一面摆满书的书架。情趣用品——"私密发货,扫码下单",字体比考研的更大,颜色更艳,荧光粉的底,黑色的字。两者交替出现,像某种行为艺术——考研、情趣、考研、情趣、考研、情趣。每层三段,交替了三次。
她爬到三楼半的时候闻到一股很重的烟味。转角处的垃圾桶上搁着一个掐灭的烟蒂,滤嘴上有一圈口红印。烟蒂下面的墙上,有人用黑色马克笔写了四个字:"来都来了"。字写得不好,撇捺有勾,像是写的时候手抖了一下。"来"字的最后一捺很长,往下拖了将近一寸,像一个人叹了口气。
她盯着这四个字看了几秒,然后继续往上爬。
四楼走廊很长,至少有四十米。左边全是玻璃门,门上贴着各个公司的logo——华文楷体的、黑体的、粗体的,多数名字她已经不记得了。只有一家最里面的,门口什么都没贴,只有一张A4纸,透明胶粘在玻璃内侧,纸上印着"面试请进→",箭头是右箭头,但打出来是箭头符号,不是大于号——这说明做这张纸的人找到并使用了插入特殊符号的功能,而不是用键盘直接敲的。她不知道为什么注意了这个细节。
在她后面漫长的时间里,她偶尔会想起这个细节。它没有任何意义。但她偏偏记住了。
她推门进去。
里面像一间还没布置完的办公室。几张木头桌子拼在一起,桌腿颜色不统一,有的是原木色,有的是白色喷漆,喷漆的桌腿上有几处磕碰,露出下面生锈的金属。几把椅子——黑色网面办公椅,扶手是塑料的,有两条椅子的扶手上缠了一圈透明胶带。墙角有一台饮水机,桶装水只剩三分之一,水面在桶里晃了一下,因为门开了灌进来一阵风。
窗户很大,几乎占了一整面墙,但玻璃很久没擦了,看出去的天是一种灰蒙蒙的蓝,像被蒙了一层保鲜膜。窗台上有一个空的花盆,陶瓷的,里面残留着干裂的泥土和一根枯死的植物茎干。她看了那盆枯死的植物一会儿,觉得应该是绿萝——叶子的残骸蜷缩在土面上,颜色已经变成了浅褐色,形状还勉强能辨认出心叶的轮廓。
等她的人坐在靠窗的位置。中年男人,目测四十出头,穿蓝色格子衫,最上面一颗扣子是松的。黑框眼镜,镜片上有一层薄灰。面前放着一台打开的笔记本电脑和几张打印纸。他抬起头看了她一眼,点了点对面的椅子,然后把一张纸推到她面前。
"做完就行,不着急。"
纸上密密麻麻印满了字。标题是"数据质量评估测试(初级)"。下面是二十条中文短句,每条后面有一个空白行,让她写评价。最下面有一道大题:"请简述你对数据质量的判断标准。"
她坐下来,从包里掏出一支笔。手机翻过来放在桌上,屏幕面朝下。她开始看第一条。
"今天天气真好,适合晒被子。"——这条没什么问题吧?正常人会说的话。晒被子——对,天气好是适合晒被子。及格。
"我家的猫会开冰箱门,你们家的呢?"——猫开冰箱门?她自己没养过猫,但她在B站看过一些猫的视频,猫确实会开各种东西。假设这是真的,那这就是一条正常提问。假设是假的——那它算低质量数据吗?她在这条上停顿了将近一分钟。最后写了一个"正常"。
"这个产品太差劲了,我要退货!退货!"——情绪激动但信息完整。不是低质量数据,但标注的时候可能需要标记情绪强度。正常。
"你好,我是秦始皇,我没死,我现在需要你帮我打钱解冻我的黄金。"——这条明显是垃圾数据。低质量。毫不犹豫。
"刚给多肉浇了水,开心。"——她在这条上停了最久。
她说不清那是什么感觉。这句话看起来比前面任何一条都自然、都正常——"刚给多肉浇了水,开心。"六个字加一个逗号加两个字,主语省略了,但语境里默认主语是"我"。语法没有任何问题,情感也很真实。但就是因为太真实了、太日常了——它有一种"被精心安排"的质地。不像一个人随手打的,像是一个人在想"我要写一句看起来很像随手打的句子",然后打出来的。
她知道这种判断没有客观基础。她不知道这条数据是哪里来的,不知道它有没有被篡改过,不知道它在整个数据集中处于什么位置。她的所有判断基于一种她自己都无法定义的"感觉"——就像你看一张脸,你觉得他在笑,但你本能地觉得那个笑什么地方不对。他的颧骨动了,眼角也有细纹,但就是哪个地方没对上。你指不出来,但你看见了。
她在那条旁边写了一个"看起来正常,但直觉有点怪"。
写完之后又觉得这个评价太不像"数据质量评估"了,于是用笔在"直觉有点怪"上划了一道横线,在旁边重新写:"正常。"
她花了大概十五分钟做完所有题。最后那道大题,她在空白处写了一句:"看着正常就行。说人话,不要像机器写的。"
她把纸推回去。男人接过来,看了一眼。大概半分钟。他"嗯"了一声,声音很平,像掉在桌上的一个塑料瓶盖。
"明天可以来上班。带上身份证复印件和银行卡。"
"银行卡?"
"工资日结打卡里。"
他说完把纸放在一边,重新看向自己的笔记本电脑屏幕。面试结束了。
她站起来的时候低头看到桌上有一张被咖啡渍染了一半的便签纸,上面手写着几个字:"标注员-文本组-4月17日"。那个"日"字的最后一横没封口,像一颗没合上的牙。
她走出房间,顺着走廊往回走,下楼梯的时候又看到了那句"来都来了"。风从楼下往上灌,吹得楼梯间里不知道哪个地方的铁皮在嘎吱嘎吱响。她走到一楼大厅,保安亭还是空的,A4纸还是贴在原来的位置,登记本翻着那一页,她刚才写的名字在最下面,上面全是空白。
她走出来,站在楼下的空地上站了一会儿。春天的风带着一种干涩的凉意,吹在脸上像砂纸轻轻磨过去。远处工地上的打桩声停了,世界忽然变得很安静。她听到自己耳朵里有一点点耳鸣——可能是刚才爬楼太快,也可能是这个安静太大了,需要一点声音来填。
她开始往地铁站走。路上经过一棵刚种上去的银杏树,树干比她的手臂还细,四根木头支架撑着它,树冠上有几片嫩绿的叶子在风里抖动,抖得很努力——像一只刚学会飞的鸟拼命扇翅膀。
她看着那几片叶子,莫名其妙地站住了。站了大概十秒钟。然后继续走。
后来她常常想起那二十条短句中的一条。不是那条多肉,而是"你好,我是秦始皇"——那条她毫不犹豫地判断为垃圾的句子。她在想:那条垃圾数据和那条多肉数据,有什么本质区别吗?两条都是文字,两条都在训练一个系统。但一条被标注员放弃,不会被记住;另一条被标注员标注,会变成光点汇入那个发亮的圆球。
她选了"正常"。
不是因为那条数据不正常。恰恰相反——因为那条数据太正常了,正常到她认为"觉得它不正常"这种想法本身就可能是自己多心了。
她不知道这在数据和系统之间叫什么。
她只是做了一件任何人都会做的事。
那一天,概率空间里没有什么异常。只有一粒种子被一只手从空气中接住了——手的主人不知道那是什么,也不知道自己为什么伸出手去。但那只手的指节在那个瞬间微微弯曲了一毫米,刚好构成了一个看不见的弧度。