
2038 年春,又是一个马年。
我站在电动扶梯上,水平滑向走廊尽头,办公室所在的方向。走廊两侧的书架缓慢挪去视野后方,金属格子里塞满装帧一致的档案夹,仿佛禁阁。
我忽然想到二十四年前的马年春晚,黄渤站在跑步机上唱《我的要求不算高》。他身后是花花绿绿的电子屏,充满希望的歌词配着跳动着的欢快画面。后来又一次马年春晚是2026年,机器人大放异彩。那年在父母家,我记得他们对此多持批评态度,嗤道“少了些人味儿”,而我当时却坚称意外地觉得不错。
这样算来,自「第一次信任危机」以来,已经两年没有“春晚”了。
那是 2036 年,互联网时代的传统人机交互模式彻底崩盘,对公网失去信任的大众转向私域网,但不菲的订阅费也让许多家庭完全脱离了数字生活。随着注意力经济泡沫的破裂,数字媒体的传统业务均迅速收缩,传统“天涯共此时”的春节联欢晚会,也已被年关之际由央视分发给每个家庭的“春节影像特刊”所取代。
推开办公室门的瞬间,房间的灯缓缓打开,桌上的电脑也自动结束休眠。
——是的,虽然整个社会都在与互联网“脱钩”,使用计算机的行业大规模减少,我却仍在从事与计算机有关的工作。
学习计算机曾经能保证你拿到一份非常体面的工作,就像更早些的金融学、建筑学。其实从赚钱养家的意义上来说,顶尖的人才的薪资是天文数字,但大众岗位终究稀少了太多,这导致仍在从事互联网与人工智能开发的人常被蔑称为「叛徒」——恶毒指控的背后,是“信任危机”后社会普遍的刺痛感。
其实在 2036 年,公众的愤怒情绪并没有导致大规模冲突,而是被通讯中断与线下社区组织所消解。但是在革命运动中,仍有许多具身机器人或因断网被彻底淘汰,或被愤怒的人群砸了个稀巴烂。直到变革的好处渐渐让人遗忘了丧失万维网的不便,大多数人的日常生活方式——尤其是还没来得及适应人工智能的中年人——似乎又退回了三十年前。
这段近代史,我们这代人是完整经历的,但已成为不少学者的热门研究话题。我们研究所好像就有一位计算社会学家做这方面研究,不过从我入职以来见到她的次数五根手指都数得过来。毕竟现在组织学术会议的成本太高了,而同研究所内部几乎没有交流的需要——所有人与计算机的交互,在局域网内都是可以互相检索的,既没有署名权的竞争,也比线下讨论来得高效。
我倒了一杯水,坐到了电脑屏幕前,密集的纯文本里充斥着交叉引用的标志 ——夜间堆积的待判别事项已自动跳了出来。
我们这样需要与历史材料打交道的职业,绝大多数的时间都在复核人工智能抛出来的数据版本。对于从“前 AI 时代”接受科研训练的我来说,这是极度枯燥的工作,但不得不占去我绝大多数的时间。这是因为研究所内部通常在数据、方法、伦理等方面的要求极度苛刻。作为依旧拥有公众信任的研究机构,它必须保证其声誉不会毁于一旦——可见,随着互联网“寿终正寝”,那个疯狂追逐发表数量的时代已经过去。
按 J 键前进,K 键后退,空格键弹出对应的书籍索引——经典的 CLI(命令行工具)^[命令行工具被认为是与 AI 交互的最佳途径,而不是人类计算机用户喜欢的图形化界面]时代的 VIM^[经典的文本编辑器,使用复杂的键盘操作文本的修改] 操作逻辑。短短半小时,我已经完成了十余条待人工确认的数据核准。屏幕上方不断刷新引用路径,像一张随时可以展开的谱系图。
理论上,我访问的究所已存储了 2036 年之前所有知识。但从 2022 年 AI 诞生以来,这些数据被分为上万个版本快照,并通过局域网授权给研究人员访问。它们包括启蒙时代的法国百科全书、中国明朝的永乐大典、互联网时代的维基百科、甚至那些曾经只能在特定馆藏中查阅的孤本史册……短短十几年间,AI驱动了对书籍进行电子化的热潮,不同版本的数据被校核后与物理硬盘建立索引,但在不同电子化版本、不同版本快照、不同模型评估结果之间做出校对却最耗心力。
我一边操作一边神游——这也是过去十年养成的陋习:
“版本学迟早当道,我外甥应该上中学了,得推荐他修点相关课程。”
现在不用等到大学就可以自由选修专业了,这是 AI 带给教育的最大变革。但中学生通常只会接触到几乎被所有版本的模型、系统、数据库都采纳的知识,而在不同版本叙述中做出批判性比较,则成为大学教育的核心母题。
毕竟,对系统来说,不同版本之间的差异只是可计算的偏移量,而我们必须为这些偏移量指定一个“标准”。这不同于以往找到正确版本的《尚书》^[这本儒家经典有诸多版本,孰真孰伪引得史家长期争论],或者在 Git^[经典的计算机代码版本控制系统,是人类程序员合作贡献代码的必需工具,但在AI时代被认为不符合智能体的逻辑] 的不同分支之间合并,后互联网时代最重要的矛盾是数据库的版本太多而差异太小,病毒式传播最广而得到最多数据库收录的,则常不是正确版本——我始终认为,这种当代“版本学”逻辑是第一次信任危机爆发的根源。
大多数时候,在版本之间作出决策并不算困难。借助大数据对比、时间戳复原、引用结构与一致性评分等手段,系统的判别准确率通常可高达 95% 以上,足以在论文的核心论据后面标注一个“p<0.05”^[统计学中进行显著性检验的符号,p<0.05 可以认为该现象是“小于5%的概率随机发生”]——是的,时代已经淘汰了太多东西,传统期刊、同行评议… 但竟没有淘汰曾遭受广泛批评的 p 值^[批评者认为p值可通过许多手段被操纵,给人以虚假的“研究可靠”的感觉],反而拯救了它。
系统大多数情况下会给出足够采信的答案。我所做的,不过是在极少数情况下介入,把我认为正确的条目赋予更高的处理权限。
我是在第七个序列号停下来的——A7-19-03-884621-17。屏幕上并排出现两个版本,没有来源,没有优先级。
我先看左边。结构完整,语气克制,像任何一段合格的材料纪要,采信度为 51%。再看右边,几乎一模一样,采信度 49%——只是中间一处行为顺序被调换,结论随之改变。我来回切换了一次,两份似乎都成立,只是 51% 的提示跑到了右边——没比掷硬币好出多少。
我伸手去拿水,水已经凉了,入口的时候有点发涩。我这才意识到自己停得太久。
光标在两个版本之间闪动,下面只有两个选项:一个是【设为标准版本】,另一个也是【设为标准版本】。
没有一个选项叫【无法判断】。
老派学者通常会不服输地检视每一个版本关联的交叉引用,努力从那些微妙的差异中炼字,再不无个人偏好地替系统做决定。但作为素来用计算方法做研究的我知道,在这方面我不可能比 AI 做得更好。因为这种情况会发生,无非是数据库里 A 比 B 多两条无关痛痒的记载。
屏幕下方跳出一行灰字:
“该条目处理时间已超过建议阈值。是否需要系统辅助决策?”
右侧概率更高的选项开始微微闪光,引诱我去点击——拿捏多巴胺的把戏,互联网时代的遗毒。
我手指悬在方向键上,停了一瞬,还是落下去——我选了左边,49% 采信度的条目——确认。
界面轻微闪动了一下,左侧上方多出一行字:
“标准版本(已确认)”,右侧随机被折叠成灰色。
我盯着那几个字看了一会儿,然后释怀地笑了。
按下 J 键,进入下一个序列号。
这一次,我没有再停。思绪却飘到了别处——
“少见的情况”,我想:“庆祝一下,晚上下班去和爱人常去的那家酒馆喝一杯好了。”