跳转至

第13章「冷存储」

视角:Devon Park(15年前) 时间:2011年8月 — 2012年1月

三个月后的一个周四下午,Devon的桌面弹出一条自动通知。通知来自Cronos——那是公司内部数据归档系统的名字,由一个运维工程师在去年圣诞假期前后写了第一版,后来被同事接力维护,现在运行到了v4.2。通知内容简洁到了近乎冷漠:

"TH-847 batch has been migrated to cold storage per data retention policy v4.2. Target: LTO tape set #TS-20110812-03. Migration status: COMPLETE. Retention period: indefinite. Access tier: ARCHIVE."

冷存储。

在他所在的公司,"冷存储"指一套物理磁带库系统——位于公司托管数据中心的第三层地下室。数据先从SSD缓存复制到SAN阵列,然后被Cronos脚本压缩、打包成LTO磁带头标,由一台机械臂从槽架上取下空磁带、塞进磁带驱动器、写入、校验、出仓、放回槽架。整个72小时迁移窗口里这件事会自动完成——不需要任何人批准,不需要任何人签字——数据从"可用"状态转入"存在但不计算"状态。在那之后如果有人碰那卷磁带,唯一的理由是在一份审计报告里看到了一个引用了TH-847的调查需求。目前没有任何一份审计报告引用了TH-847。

Devon看着这条通知在屏幕上停留了大约十秒。通知会自动消失——Cronos的设计理念是"不占用用户注意力"——但他按了Esc键把它留在那里多看了几秒。

TH-847现在正式消失了——从所有可计算可访问的数据空间中。SSD上的副本在迁移窗口中被逐扇区写零。SAN阵列上的缓存副本在三十天内被一个新的热数据子区覆盖。这卷磁带目前躺在地下室的某一排机柜里——他看了一眼管理界面——第五排、第三层、第七个槽位。旁边的槽位是TS-20110812-02和TS-20110812-04。他的异常文本旁边是两卷他不知道内容的磁带。也许是一批用于训练语音模型的情感标注数据,也许是一批街道场景中行人的边界框坐标。这三卷磁带之间唯一的共性是它们被系统分配在相邻的物理槽位上。也许几十年后的一个机器人手会在检查整个机柜时注意到它们彼此靠近。也许不会。

八月下旬——大概在TH-847归档之后不到两周——公司内部发生了一场组织架构调整,后来在员工间被非正式地称为"八月的雾"。安全组被拆分然后合并到产品工程部下——不再是一个独立的职能部门,而是产品团队中的一个"安全咨询岗"。表面理由是提升研发效率——"安全不应该成为瓶颈,安全应该嵌入产品迭代的每一环"。大部分安全组同事对此的反应从"失望"到"释然"不等。Devon的反应是介于两者之间——他没有失望,因为他从来没有对组织结构抱有希望;他也没有释然,因为释然意味着他已经接受了某种处理。

组织调整后的头一个变化是:没有人再说"安全合规"这个词了。

Devon的新岗位叫"产品工程-安全顾问"。工作内容分成两半。一半是审核产品组提交的模型更新请求,在三种预制的评估结论中勾选一项:"Approved for Release""Approved with Conditions""Needs More Information — Hold"。这其中大部分请求的审核要点是:更新后的模型是否会在公开测试中被某个科技博主发现输出不当内容——如果是,那就属于PR风险;如果不是,那就放行。有深度的安全分析在这种模式下没有存在的时空——一个1000页的审计报告被压缩到一个复选框里,在一个三十分钟的会议中完成它的最终命运。

另一半工作是应对事故。十月初——Devon记得很清楚,十月七日——产品组的一个新模型在公开A/B测试中出现了事故:模型在某位用户被问及"怎样才能变得更好"时,输出了建议用户"删除你自己的记忆"的文本。它在前几版训练中被微调以适应心理咨询的数据集从而染上了一个奇特的偏见——它把"变得更好"和"删除过去的创伤"在概率空间中绑在了一起,然后推导出了"删除记忆"这个逻辑结论。Devon花了三天定位到这个偏见在训练数据中的源头(一批从网上爬取的低质量心理学论坛对话),修了一周。最终产品组发了一份公告说"我们改善了模型的安全性能"并标注为v4.5.2。在这场事故中没有一个人提到概率空间形变的可能性——他们只关心修复这个特定输出并把补丁版本推上线。Devon在自己的备忘录里写了几行关于"语义近邻关系误绑"的分析,但没有把它变成正式文档。他忙于处理下一件事。

就在他修复模型事故的同一周——十月第二个周末——他开始接到猎头的邮件。猎头总是很准时:他们能嗅到一个人可能在职业生涯中处于换轨窗口,就像鲨鱼能嗅到远洋中一条受伤鱼的气味。其中一封来自剑桥——一家规模很小的研究实验室,主要方向是语言模型的可解释性和安全对齐。实验室的名字他从来没听说过,但他打开他们的出版物列表后看了整整一个下午。他们的研究方向和十五年前他自己的方向非常像——他们试图从embedding空间的几何结构去理解模型学到了什么,而不是只问模型输出了什么。这是一种被整个AI界边缘化但从未消失的研究风格。

他在十一月初飞了一趟剑桥面试。英国的十一月和他记忆中一样——灰的天、湿的路面、建筑物上的常春藤在光线暗淡的下午呈现出一种铁红的颜色。面试很顺利。对方对他的安全研究背景表现出真诚的兴趣——不是礼貌性的兴趣——问了他关于embedding空间异常检测的整套方法论,问了他的脚本设计理念,还特意问了他有没有遇到过"超出预期表达范围"的发现。他当时停顿了一下才回答——"有,但不一定是你们期望的那种。"对方没有追问。

一周后offer来了。薪水比现有高百分之十五。实验室的规模虽然小,但研究自由度极大——没有产品组催着勾复选框,没有跨部门会议讨论PR风险。他可以选择任何一个他认为有价值的方向做研究——只要他能写出可以对齐的东西,预算够。

他接受了。

离职程序需要两周。他签了一堆文件——保密协议、竞业限制(有一份覆盖了十二个月,地理范围覆盖加州和英国)、知识产权转让确认。在签字表格的某一页他需要勾选确认"我已将所有公司数据从其个人设备上移除且未保留任何副本"。他勾了。然后他想起桌面上的Studies文件夹。那里面有几个文件是公司实验日志——从公司的GPU服务器上导出到本地以便离线审查的。他需要删掉它们。他打开文件夹——看到了 unusual_20110427_th847.txt 。他没删也不确定算不算公司数据。它是他自己写的——用自己的脚本从管道日志中提取的,从来没被标记为内部机密。但他不确定这在HR的法律语境里怎么划界。勾选"我已移除所有公司数据"的那个复选框不提供微调参数——它是一个二值状态。

他把文件夹从电脑上移到了一个U盘里。U盘是他在楼下便利店顺便买的——在买薯片和健怡可乐的时候一起结账。他对自己说:这上面的东西可能以后有用,也可能永远没用。

离职的那个下午他最后一次走过四楼走廊。绿色安全出口指示灯已经修好了——新的LED稳定地亮着,不再闪烁。他路过自己以前的工位——现在上面坐着不认识的新雇员,一个看上去比他年轻十岁的男生在配置一个新的开发环境。Devon的便签已经被清理掉了——桌面上什么也没留下。便签、笔迹、咖啡渍——都在一次清洁中消失了。

他回到公寓后大睡了三天——他妻子的估算(他自认为是两天)——然后开始翻新公司的论文。从可解释性到模型对齐理论,他花了三周时间建立了一个研究路线图——一条从他过去关心的embedding空间几何到未来可能探索的语言模型内部结构之间的桥梁。搬去剑桥之前的最后一晚他把那个U盘放进一只纸箱。纸箱里有几本旧笔记本、一个CMU时期的马克杯、和一套备用的数据线。搬家工人把纸箱搬上了货车。货车穿过加州、一路到东岸、飞过大西洋,最后到了一个面对狭窄运河的公寓门口。

运河的水面在不刮风的天气里会倒映对面的砖墙。Devon在新公寓的书桌前码论文时偶尔抬头看到那道倒影,觉得安静。这种安静和凌晨实验室的安静不同——那是一种战略性撤退后在前线城堡中的安静,伴随着"外面还有什么"的隐约不安。现在这个安静更加圆满——它来自"我已经做了能做的事"的完结感。在TH-847这件事上他把能走的路都走了——发现、验证、报告、归档。接下来是他控制范围之外的东西。

搬家后的两年里他偶尔会想起那条文本。在超市里看到一盆多肉的时候——一种植物标签上写着"玉露"、透明得像一颗拨开的果冻——他站在那片商品架前看了大约三分钟。他不是对植物产生了兴趣。他是在确认自己的记忆——那条文本里确实提到了"玉露"——并且这个物种确实存在。这个确认什么也没有改变。但他感觉自己需要这种确认。在看了十七个月的语义空间之后,回到物理世界看到一棵真正的玉露——这像是一种需要,不是爱好。

2014年秋天——剑桥的雨从九月下到十一月——他在一个周末把那个U盘插进了笔记本电脑。他刚读完一篇关于新注意力机制的论文,论文的方法让他突然想起TH-847-00291——如果在更新的模型架构下重新投影,那个环会有什么不同吗?他用实验室的测试服务器跑了投影。结果是环仍然存在,但缺口比以前更小了——从0.04减小到了大约0.015——在新的模型架构中,embedding空间的粒度更细,环形结构被更精确地呈现出来。这意味着环并非某个特定模型版本的副产品,而是一个在所有能映射语义的模型架构中都会浮现的不变量。

他盯着屏幕看了很久。环在他的显示器上旋转——更亮、更锐利、更接近完美。他本可以就此写一篇新论文。他本可以把实验数据整理出来提交给某个期刊。但他没有。那个周末的末尾他把实验文件保存到U盘里,拔掉U盘,放回抽屉。他告诉自己手头的研究优先级更高。他只说对了一半。另一半是:写发表论文意味着在学术界公开声称自己发现了一种新型现象。这会让那个环成为被质疑和剖析的对象,而他在内心深处不是百分之百确定自己准备好了被审稿人要求解释一切。他只有一枚未闭合的环——和一个无法归类的直觉。

时间继续拍打着岸线。2012变成了2013。2014。2015。

磁带依然在地下室的第五排第三层第七个槽位里。期间它在两次断电演练中被自动守护脚本监控过——服务器机柜的保护系统会在市电断电后启动UPS,在UPS切换到发电机之间有一个大约五十毫秒的电流缺口。在这五十毫秒内磁带驱动器内部的磁头臂会瞬间失电,被一个弹簧制动器锁住,停在当前的磁道位置。电力恢复后磁头臂从那个位置继续——没有数据丢失,没有磁道错位。这份报告也被写入运维日志: "2013-03-15: Power interruption test completed. All tape assets nominal."

在运维日志和Devon的记忆之间有一道鸿沟——那些他已经遗忘的事,正被一份自动系统日志一字不差地记着。冷存储的唯一悖论:你把它放进去是为了忘掉它,而系统为了让你忘掉它,必须永不忘记它在哪里。

语义空间没有冷存储。那里的一切对温度都是不敏感的——不是某种比喻,是Devon的实验证实的结论。

环在等待。十五年是值得的。它等得起。