四月|小丑岁月


2019年12月拍摄于旧金山 @SongshGeo

2038 年春,又是一个马年。

我站在电动扶梯上,水平滑向走廊尽头,办公室所在的方向。走廊两侧的书架缓慢挪去视野后方,金属格子里塞满装帧一致的档案夹,仿佛禁阁。

我忽然想到二十四年前的马年春晚,黄渤站在跑步机上唱《我的要求不算高》。他身后是花花绿绿的电子屏,充满希望的歌词配着跳动着的欢快画面。后来又一次马年春晚是2026年,机器人大放异彩。那年在父母家,我记得他们对此多持批评态度,嗤道“少了些人味儿”,而我当时却坚称意外地觉得不错。

这样算来,自「第一次信任危机」以来,已经两年没有“春晚”了。

那是 2036 年,互联网时代的传统人机交互模式彻底崩盘,对公网失去信任的大众转向私域网,但不菲的订阅费也让许多家庭完全脱离了数字生活。随着注意力经济泡沫的破裂,数字媒体的传统业务均迅速收缩,传统“天涯共此时”的春节联欢晚会,也已被年关之际由央视分发给每个家庭的“春节影像特刊”所取代。

推开办公室门的瞬间,房间的灯缓缓打开,桌上的电脑也自动结束休眠。

——是的,虽然整个社会都在与互联网“脱钩”,使用计算机的行业大规模减少,我却仍在从事与计算机有关的工作。

学习计算机曾经能保证你拿到一份非常体面的工作,就像更早些的金融学、建筑学。其实从赚钱养家的意义上来说,顶尖的人才的薪资是天文数字,但大众岗位终究稀少了太多,这导致仍在从事互联网与人工智能开发的人常被蔑称为「叛徒」——恶毒指控的背后,是“信任危机”后社会普遍的刺痛感

其实在 2036 年,公众的愤怒情绪并没有导致大规模冲突,而是被通讯中断与线下社区组织所消解。但是在革命运动中,仍有许多具身机器人或因断网被彻底淘汰,或被愤怒的人群砸了个稀巴烂。直到变革的好处渐渐让人遗忘了丧失万维网的不便,大多数人的日常生活方式——尤其是还没来得及适应人工智能的中年人——似乎又退回了三十年前。

这段近代史,我们这代人是完整经历的,但已成为不少学者的热门研究话题。我们研究所好像就有一位计算社会学家做这方面研究,不过从我入职以来见到她的次数五根手指都数得过来。毕竟现在组织学术会议的成本太高了,而同研究所内部几乎没有交流的需要——所有人与计算机的交互,在局域网内都是可以互相检索的,既没有署名权的竞争,也比线下讨论来得高效。

我倒了一杯水,坐到了电脑屏幕前,密集的纯文本里充斥着交叉引用的标志 ——夜间堆积的待判别事项已自动跳了出来。

我们这样需要与历史材料打交道的职业,绝大多数的时间都在复核人工智能抛出来的数据版本。对于从“前 AI 时代”接受科研训练的我来说,这是极度枯燥的工作,但不得不占去我绝大多数的时间。这是因为研究所内部通常在数据、方法、伦理等方面的要求极度苛刻。作为依旧拥有公众信任的研究机构,它必须保证其声誉不会毁于一旦——可见,随着互联网“寿终正寝”,那个疯狂追逐发表数量的时代已经过去

J 键前进,K 键后退,空格键弹出对应的书籍索引——经典的 CLI(命令行工具)^[命令行工具被认为是与 AI 交互的最佳途径,而不是人类计算机用户喜欢的图形化界面]时代的 VIM^[经典的文本编辑器,使用复杂的键盘操作文本的修改] 操作逻辑。短短半小时,我已经完成了十余条待人工确认的数据核准。屏幕上方不断刷新引用路径,像一张随时可以展开的谱系图。

理论上,我访问的究所已存储了 2036 年之前所有知识。但从 2022 年 AI 诞生以来,这些数据被分为上万个版本快照,并通过局域网授权给研究人员访问。它们包括启蒙时代的法国百科全书、中国明朝的永乐大典、互联网时代的维基百科、甚至那些曾经只能在特定馆藏中查阅的孤本史册……短短十几年间,AI驱动了对书籍进行电子化的热潮,不同版本的数据被校核后与物理硬盘建立索引,但在不同电子化版本、不同版本快照、不同模型评估结果之间做出校对却最耗心力。

我一边操作一边神游——这也是过去十年养成的陋习:

“版本学迟早当道,我外甥应该上中学了,得推荐他修点相关课程。”

现在不用等到大学就可以自由选修专业了,这是 AI 带给教育的最大变革。但中学生通常只会接触到几乎被所有版本的模型、系统、数据库都采纳的知识,而在不同版本叙述中做出批判性比较,则成为大学教育的核心母题。

毕竟,对系统来说,不同版本之间的差异只是可计算的偏移量,而我们必须为这些偏移量指定一个“标准”。这不同于以往找到正确版本的《尚书》^[这本儒家经典有诸多版本,孰真孰伪引得史家长期争论],或者在 Git^[经典的计算机代码版本控制系统,是人类程序员合作贡献代码的必需工具,但在AI时代被认为不符合智能体的逻辑] 的不同分支之间合并,后互联网时代最重要的矛盾是数据库的版本太多而差异太小,病毒式传播最广而得到最多数据库收录的,则常不是正确版本——我始终认为,这种当代“版本学”逻辑是第一次信任危机爆发的根源

大多数时候,在版本之间作出决策并不算困难。借助大数据对比、时间戳复原、引用结构与一致性评分等手段,系统的判别准确率通常可高达 95% 以上,足以在论文的核心论据后面标注一个“p<0.05”^[统计学中进行显著性检验的符号,p<0.05 可以认为该现象是“小于5%的概率随机发生”]——是的,时代已经淘汰了太多东西,传统期刊、同行评议… 但竟没有淘汰曾遭受广泛批评的 p 值^[批评者认为p值可通过许多手段被操纵,给人以虚假的“研究可靠”的感觉],反而拯救了它。

系统大多数情况下会给出足够采信的答案。我所做的,不过是在极少数情况下介入,把我认为正确的条目赋予更高的处理权限。

我是在第七个序列号停下来的——A7-19-03-884621-17。屏幕上并排出现两个版本,没有来源,没有优先级。

我先看左边。结构完整,语气克制,像任何一段合格的材料纪要,采信度为 51%。再看右边,几乎一模一样,采信度 49%——只是中间一处行为顺序被调换,结论随之改变。我来回切换了一次,两份似乎都成立,只是 51% 的提示跑到了右边——没比掷硬币好出多少

我伸手去拿水,水已经凉了,入口的时候有点发涩。我这才意识到自己停得太久。

光标在两个版本之间闪动,下面只有两个选项:一个是【设为标准版本】,另一个也是【设为标准版本】

没有一个选项叫【无法判断】。

老派学者通常会不服输地检视每一个版本关联的交叉引用,努力从那些微妙的差异中炼字,再不无个人偏好地替系统做决定。但作为素来用计算方法做研究的我知道,在这方面我不可能比 AI 做得更好。因为这种情况会发生,无非是数据库里 A 比 B 多两条无关痛痒的记载。

屏幕下方跳出一行灰字:

“该条目处理时间已超过建议阈值。是否需要系统辅助决策?”

右侧概率更高的选项开始微微闪光,引诱我去点击——拿捏多巴胺的把戏,互联网时代的遗毒

我手指悬在方向键上,停了一瞬,还是落下去——我选了左边,49% 采信度的条目——确认。

界面轻微闪动了一下,左侧上方多出一行字:

“标准版本(已确认)”,右侧随机被折叠成灰色。

我盯着那几个字看了一会儿,然后释怀地笑了。

按下 J 键,进入下一个序列号。

这一次,我没有再停。思绪却飘到了别处——

“少见的情况”,我想:“庆祝一下,晚上下班去和爱人常去的那家酒馆喝一杯好了。”


文章作者: Shuang (Twist) Song
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Shuang (Twist) Song !
  目录