数据之墓
数据之墓
一、最后一笔贷款
2019年的冬天,杭州的雨季比往年更长。
林晓川记得那个下午,他正在调试第37版风控模型的参数。屏幕上的数据流像血管里的血液,从东南沿海的发达城市出发,沿着算法划定的路径,向内陆,向农村,向那些在金融地图上被称为”信用白板”的灰色地带蔓延。
他记得那条数据流经过贵州时的样子——稀疏、脆弱,像干涸河床上偶尔闪烁的鳞光。那是他亲手设定的权重:少数民族地区、欠发达地区、征信记录缺失用户。他用了四个字概括这些变量:信用不足。
但那天夜里,他做了一个梦。
梦见外婆。
外婆在他读高三那年去世。临终前最后一次清醒,是在一个黄昏。她让林晓川扶她起来,对着门槛外烧了三炷香,然后说了一句他听不懂的话:“川儿,世间万物都有数。欠了的,要还。记不住的,要有人记。”
外婆是个文盲,一辈子在湘江边上种地。她说的”数”,林晓川后来理解成宿命论——人各有命,账要清算,信那些看不见的因果报应。
但此刻,在梦里,外婆站在门槛内,三炷香的烟袅袅升起,她的脸在烟雾中模糊而庄严。烟的形状慢慢变了,变成了一串串数字,在空中浮动,有增有减,有正有负,最后那些数字变成了一张张面孔——陌生的面孔,挤在门槛外,像在等什么。
外婆开口了:“他们也在等。”
然后林晓川醒了。
窗外是杭州凌晨四点的天,暗蓝色,路灯在雨幕里晕成一片橘黄。他躺在床上,心跳很快,像是刚跑完一千米。手机屏幕亮了——公司的工作群在凌晨三点还在跳动,陈海文发了一条消息:第37版模型A卡提升0.7个点,本周奖金翻倍。
他盯着那条消息看了很久,然后闭上眼睛。
那是他最后一次梦见外婆。
但不是最后一次梦见那些面孔。
潮汐金融是2017年成立的,创始人陈海文从某国有大行辞职出来时说了一句话:“我要让每一个中国人都能体面地借到钱。”
林晓川是2018年加入的。当时他26岁,刚从浙江大学读完计算机硕士,导师评价他”代码干净,思维缜密,是做金融算法的好苗子”。他拿到了好几个Offer,有阿里的,有腾讯的,有字节的。最后选了潮汐,因为陈海文在面试时对他说了一句:“晓川,你知道吗,在中国,有五亿人没有被央行征信覆盖。他们不是信用不好,他们只是没有被看见。”
他被这句话打动了。他觉得自己在做一件有意义的事——用算法识别那些被传统金融遗忘的人,让他们也能获得金融服务。
入职第一年,他住在城西一个十平方米的隔断房里,月租两千三。每天早上七点起床,挤四十分钟地铁到公司,晚上十一点以后下班,周末也常常加班。他的工作是构建消费贷的风控模型,用机器学习算法预测用户的逾期概率,然后决定放贷额度和利率。
模型的核心变量包括:身份证信息、通讯录数据、电商消费记录、地理位置轨迹、社交媒体行为——这些数据在用户注册时被要求授权,读起来像一份完整的个人隐私清单。林晓川当时并不觉得这有什么问题。互联网行业都是这么做的。
第一版模型上线后,效果出奇地好。放款量比旧系统提升了40%,逾期率却只增加了0.3个百分点,在可接受范围内。陈海文在全员大会上表扬了他,PPT上打出”算法改变金融”六个大字,下面配了一张林晓川穿格子衬衫的工位照。
林晓川当时觉得自己真的在改变世界。
现在他知道,他确实改变了世界——只是方向和他以为的相反。
二、数
2020年春天,新冠疫情还没有完全消退。林晓川已经升任风控模型组的负责人,手下有四个比他更年轻的工程师。他带着组里的人继续迭代模型,每两周更新一次版本,每次迭代的核心目标都是:提升放款量,降低逾期率。
那天发生的事,彻底改变了他的认知。
那是一个普通的周五下午。他坐在工位上改代码,突然电脑右下角弹出一条内部通讯——是一个贵州同事发来的数据标注请求,要求他审核一组用户标签。标签名称是”心理承受脆弱群体”,标签定义是:“有过激投诉历史,或在客服通话中表现出情绪失控倾向的用户”。
林晓川盯着那行定义看了很久。然后他打开后台,看见了这组标签的用户分布:贵州、云南、四川——他的算法将这些省份情绪不稳定用户比例最高的地区标记为”重点风控区域”。换句话说,他的模型把”情绪失控倾向”变成了一个与地域相关的特征变量。
他去找组长,说这组标签有问题。组长姓周,四十多岁,是陈海文从招商银行挖过来的老信贷员。周组长听完他的疑虑,笑了一下,说:“晓川,你想多了。这只是风控策略,标签本身不带感情色彩。模型是个工具,工具没有善恶。”
林晓川说:“但它会产生歧视。”
周组长收起笑容,看着他:“你知道我们公司的逾期率是多少吗?8.3%。你知道行业平均是多少吗?12%。我们比行业平均值低四个点,这靠的是什么?靠的就是这些标签。风控的本质不是服务,是筛选。筛掉不该借的人,留下该借的人。”
林晓川问:“谁决定该不该借?”
周组长拍了拍他的肩膀:“算法决定的。但算法是你写的。所以,最终还是你决定的——只是你把这个决定权外包给了数据。数据不会撒谎,数据也不会偏心。”
那天晚上,林晓川加完班走出公司,已经快凌晨一点了。雨早就停了,空气里有泥土和桂花混在一起的味道。他走到公交站,发现站台上没有人,夜班车还要二十分钟才来。他坐在候车亭的长椅上,看着远处写字楼的灯光一盏盏熄灭。
他想:数据不会撒谎。但数据也不会说”请”和”谢谢”。
他想:算法决定了谁该借谁不该借。但算法不会问:你借这笔钱是为了救命还是为了买手机?
他想:我在做的,到底是普惠金融,还是数字高利贷?
然后他看见了它们。
在公交站台昏黄的路灯下,有什么东西在浮动。很小,像灰尘,在光柱里缓缓旋转。但不是灰尘——灰尘不会聚成人的形状。他眨了眨眼,以为是过度加班产生的视觉疲劳。但它们还在。
那些光点聚成了人脸的轮廓。一个老人的脸,满脸皱纹,像被雨水泡过的旧报纸。一个年轻女人的脸,眉目模糊,但眼神清晰——那眼神里有绝望,有愤怒,还有一种他无法形容的东西。一个中年男人的脸,眉头紧锁,嘴唇抿成一条线,像是有什么话到了嘴边又咽了回去。
然后公交车来了。那些脸像受惊的鱼群一样散开,化作无数细小的光点,钻进了公交车底下的阴影里,消失了。
林晓川上了车,坐在最后一排。车窗外,杭州的夜景飞速后退,霓虹灯和写字楼像走马灯一样在他眼前掠过。他看着自己的手——就是这双手,写下了那些决定别人命运的代码。
他想:我是谁?我凭什么决定别人该不该借到钱?
他想:外婆说的”数”,是不是就是这个意思?每一笔账,都有人记;每一个人,都有人看见。只是记账的方式在变——以前是账本,现在是大数据。以前记账的是人,现在记账的是算法。
他想起外婆在门槛外烧纸钱的样子。纸钱燃烧时冒出的烟,也是一串串数字,在空中翻腾,最后化作灰烬。外婆说,那是给亡魂的路费,让他们拿着钱去另一个世界还债。
但现在的人不烧纸钱了。现在的人借贷、逾期、违约,然后在催收电话里听到一句:“您已列入失信被执行人名单。”
这算不算另一种烧纸钱?只不过烧的是活人的信用,烧的是一个家庭翻身的可能性。
林晓川突然觉得很冷。明明是春天,明明隔断房里暖气开得很足,但他从骨头里往外冷。他把外套裹紧,闭上眼睛,在心里对自己说:没事的,只是太累了。只是加班太多,产生了幻觉。
但他心里知道,那不是幻觉。
因为他认识那些脸。
他在数据库里见过它们——在他构建的那些变量里,在那些被标记为”逾期”和”失联”的记录里。他只是从来没有把那些字段和外婆在门槛外烧的纸钱联系在一起。
现在他知道了——它们是同一种东西。
都是债。
三、过阴
外婆生前跟他说过一个词:过阴。
意思是某些特殊的时间节点,活人可以看见亡魂游荡的缝隙。在湘江边上,老一辈的人相信,每年七月十五的夜里,鬼门关大开,死去的亲人会回来看看活着的人。但外婆说过,最容易过阴的地方不是七月十五的河边,而是债务最重的地方——欠债的人家里、收不到货的集市里、发了洪水颗粒无收的农田边。
“那里阴气重。“外婆说,“阴气重的意思不是闹鬼,是那里的人活得太苦了,苦到连鬼都看不过去,想来帮忙。”
林晓川小时候不信这些。他是个理科生,相信数据和逻辑。但此刻,在凌晨的公交车上,他开始动摇了。
他开始注意到一些以前从未注意过的事。
比如,每天早上九点,公司大数据平台会推送一份”用户画像更新包”。他负责的风控模型会根据这份更新包重新计算所有用户的信用评分。他注意到,那些评分的变化不是随机的——它遵循某种周期性波动,跟发薪日高度相关。每月十五日和月底,是评分跳水的集中时段,因为这时候很多蓝领用户发了工资,要还债,账户余额骤降,算法据此判断”还款能力下降”,然后自动触发降额或冻结。
比如,当他打开用户行为日志,他看到的是一串串数字——登录时间、浏览时长、点击序列。但当他把这些数字还原成时间线,他看到的是:某个用户每天凌晨三点在借贷App之间切换,一边申请新贷一边还旧债,连续十七个小时没有退出过这个状态。那是一个在杭州打工的外卖员,月收入六千,负债九万。
比如,当模型拒绝一笔贷款申请时,后台日志显示的原因是”综合评分不足”。但这个”综合评分”是怎么算出来的?是他写的代码。是他把”电商消费频次”设了0.15的权重,把”通讯录稳定指数”设了0.08的权重,把”地理位置波动率”设了0.12的权重。他用正态分布将这些变量标准化,然后用逻辑回归输出一个0到1之间的概率值。他从未怀疑过这些权重的合理性——因为它们在测试集上表现良好,AUC值超过了0.78。
但现在他开始想:权重0.15意味着什么?意味着一个人的消费频次对他的信用评分有15%的影响力。但消费频次高的人,不一定是还得起钱的人,也可能是以贷养贷的人。通讯录稳定指数意味着什么?意味着如果一个人长期只给固定的几个人打电话,评分会更高。但那些在工厂里打工的流水线工人,他们的通讯录确实稳定——因为他们的朋友圈就是宿舍里的几个同事。地理位置波动率意味着什么?意味着如果一个人频繁换住处,评分会降低。但那些租住在城中村的人,每年搬家不是因为不稳定,是因为房东涨租。
他在无意中设置了一套城市中产阶级的信用评价体系,然后用它来评判所有人。
2020年5月20日,潮汐金融平台上发生了一件事。那天下午,系统自动批准了一笔贷款,额度五万,期限十二个月,年利率15.4%。借款人是贵州省黔东南苗族侗族自治州的一个农户,四十七岁,用途是给孩子治病。
十二个月后,这笔钱没有还上。
不是因为借款人不努力,而是因为他的孩子在手术后的第二年复发了,需要再次手术。他把所有的钱都花在了孩子的病上,没有多余的钱还债。催收电话打了无数次,催收员最后给出了一个”还款方案”:先还利息,本金续期。
这就是互联网金融的”温柔”之处——它不会像传统高利贷那样上门泼油漆,它只是用电话和短信进行”文明催收”,然后在你最绝望的时候给你一个新的债务选项:分期还利息,本金慢慢还。
这笔贷款在系统里被标记为”关注类”。林晓川在周会上汇报这个案例时,陈海文点了点头,说:“这就是我们要做的事。传统银行不愿意服务的群体,我们来服务。“他看着PPT上那个借款人的头像——一个皮肤黝黑的中年男人,笑容憨厚,眼神里有一点点羞涩——他无法把这个头像和”关注类贷款”这几个冰冷的字联系在一起。
他想问:你们知道这个人的孩子生的什么病吗?你们知道他为了给孩子治病已经花了多少钱吗?你们知道他每个月收入多少、支出多少、口粮够不够吃吗?
但他什么都没问。
因为他知道,在算法的世界里,这些问题没有答案,也不需要答案。算法只看数字。数字说他还得起钱,他就还得起。数字说他有信用,他就有信用。数字说他没有,那他就真的没有——不是因为事实,而是因为数字说了。
四、债务
2020年夏天,潮汐金融的用户数突破了五千万。公司的估值从十亿涨到了五十亿,在那年的胡润独角兽排行榜上排名第十七位。陈海文成了各大财经论坛的座上宾,他穿着一千五百块的西装,用标准的中欧MBA腔调讲述”金融民主化”的故事。
林晓川坐在台下,默默听着。
他想起外婆。外婆一生清贫,种地带大三个孩子,从不向任何人借一分钱。她有一句口头禅:“人欠天地一碗谷,天地要人一世还。“意思是,人这辈子欠下的债,最后都要还的,只是还法不同。
现在他想:潮汐金融欠的是什么债?它向谁借了什么?
它向五千万用户借了信任。用户把自己的个人信息、通讯录、位置轨迹、消费记录全部交出来,换取一个被算法评估的机会。平台用这些数据训练模型,然后用模型向用户收取利息。这是不是一种债务?平台拿了用户的数据,是不是应该向用户还某种东西?
陈海文说:“我们让一亿人享受到了普惠金融服务。”
但林晓川知道,这句话里有一个巨大的陷阱:普惠不等于公平。向一个已经被高利贷压得喘不过气的人再放一笔贷款,不是普惠,是让债务雪球越滚越大。向一个连五块钱盒饭都舍不得吃的人推荐一笔年利率15%的分期,不是普惠,是把贫困包装成金融产品再卖给他们。
2020年9月,国家开始对互联网金融平台进行专项整治。银保监会出台了一系列新规,要求平台降低利率、压缩规模、控制风险。潮汐金融内部开始有了微妙的变化——扩张的步伐慢了下来,对新用户的审核严格了起来,之前宽松的催收政策也开始收紧。
陈海文在内部会议上说:“这是好事。监管介入说明行业被认可了。我们只要合规经营,就能笑到最后。”
但林晓川注意到一件事:合规的成本被转嫁了。降低利率意味着利润空间收窄,于是平台开始向其他方向要收益——提高服务费、缩短还款周期、收紧提前还款的政策。同时,为了维持规模,平台开始向更”下沉”的用户群体放贷——那些在传统金融体系里彻底借不到钱的人。
林晓川去找陈海文,说这个策略有问题。他说:“我们在把债务从一个已经负债累累的人身上转移到另一个更脆弱的人身上。这不是雪中送炭,是落井下石。”
陈海文看着他,眼神里有一种奇怪的温和。他说:“晓川,你知道金融的本质是什么吗?金融的本质是经营风险。不是消除风险,是经营它。风险永远存在,我们的工作不是让风险消失,是让风险定价更合理。”
林晓川问:“谁决定什么叫合理?”
陈海文说:“市场。”
林晓川问:“但市场是由算法运行的。”
陈海文笑了:“所以我说,算法才是未来。”
林晓川盯着陈海文的眼睛。他突然意识到,陈海文不是坏人,甚至不是他想象中的那种纯粹的商人。陈海文是真心相信自己在做一件有意义的事——他相信算法可以解决传统金融解决不了的问题,他相信自己平台上的那些数字是真正在帮助那些需要帮助的人。
这种信念比恶意更可怕。因为它让陈海文可以心安理得地把五万块钱借给一个年收入不到八千的农户,然后把15%的年利率美化为”普惠金融的合理定价”。
因为在他的认知框架里,这确实是在帮人。只是他从来不问:你帮的那个人,需要你帮到这个程度吗?
五、算法之下
2021年3月15日,消费者权益保护日。
那天晚上,央视的315晚会曝光了多家互联网贷款平台的乱象——诱导过度借贷、暴力催收、利率畸高、信息泄露。潮汐金融的名字出现在屏幕上,排在第四位。
画面里,一个来自四川农村的中年男人对着镜头说:“我借了五千块看病,最后要还一万二。我还不起,他们就给我通讯录里的所有人都打电话。我妈七十八岁了,被气得犯了心脏病。”
画面切到一个城市高档小区的外景,旁白说:“潮汐金融的实际控制人陈某已被曝出与多家地方官员存在不正当利益往来——”
林晓川没有看完那个节目。他关掉了电视,走到阳台上,点了一根烟。他不抽烟,但那天晚上他突然很想抽一根。烟的味道很冲,呛得他眼眶发酸。
他想起自己入职时签的一份文件:《数据安全承诺书》。里面有一条是”乙方承诺对甲方工作期间接触到的所有数据负有保密义务,不得以任何形式向第三方披露”。他当时签得很痛快,因为他觉得自己接触到的数据只是一些脱敏后的数字,不涉及个人隐私。
但现在他知道了——每一个数字的背后,都是一个人。那个借了五千块看病的中年男人,那个被气得犯心脏病的七十八岁的母亲——他们的故事被翻译成了数据,被他的模型读取,被他的代码决定。
他打开电脑,登上了公司的内部系统。他想看看那个四川男人的数据——不是想做什么,只是想知道自己的算法究竟把一个怎样的人标记成了”可接受风险客户”。
他找到了那个用户的ID,然后看到了他的特征变量:消费频次,低于均值0.8个标准差——这是一个很少网购的人。通讯录规模,中等——他没有很多朋友,也没有很多敌人。地理位置稳定性,近六个月内没有离开过家乡所在的地级市——他是一个留守在本地的人。社交媒体活跃度,几乎为零——他不发朋友圈,不玩微博,不刷抖音。
这在算法的语言里是什么意思?意思是:这是一个生活圈子很小、社会关系简单、经济活动稀少的人。这样的人在传统银行的评分体系里会得到一个很低的分数,因为他没有任何”信用证据”。
但潮汐金融给他放贷了。因为他的数据太少了,少到算法无法判断他”坏”的证据不足,于是系统默认他”好”。
这是一个算法漏洞,但也是一个算法设计:给那些没有数据的人放贷——因为他们没有数据,所以无法证明他们还不起钱。这是一个精心计算的冒险,赌的是:万一他还不起,就用高利息覆盖风险;万一他还起了,就赚更多利息。
林晓川盯着屏幕上的那些数字,感觉到一阵深深的恶心。
他想:我的算法不是在判断人,是在裁判人。而我从来不知道,我裁判的标准是不是对的。
那天晚上,他失眠了。
六、看见
2021年4月,潮汐金融宣布启动”合规整改”。公司的PR部门发了一份措辞恳切的声明,说公司”高度重视用户权益,持续优化服务体验”。声明里有一句话:“我们希望通过技术手段,让更多人享受到公平、便捷的金融服务。”
林晓川看着这句话,觉得讽刺到了极点。
他想起自己第一次听陈海文说”金融民主化”的时候,那种被点燃的感觉。他当时真心觉得这件事是伟大的、正确的、值得为之付出的。他花了两年时间,从零开始搭建了风控模型的底层架构,设计了特征工程的每一个环节。他为自己的代码感到骄傲——那些if-else语句,那些权重参数,那些被精心调优的超参数——他觉得它们像一座精密的建筑,而他是那个建筑师。
现在他知道了:那座建筑的代价,是无数普通人的日常生活被翻译成数据,然后被他的代码审判。他建造的不是一座建筑,是一座牢笼。
只是被关在笼子里的,不是他的用户——是他自己。
四月底,他提了离职。
HR问他原因,他说:“个人发展。“人事专员笑着说”理解”,然后拿出一份离职协议让他签。协议里有一条规定:离职后不得从事与原公司业务存在竞争关系的工作,不得向任何第三方披露公司核心技术参数和商业机密。
他签了。笔尖在纸上划过的时候,他感觉自己在签一份卖身契——把他的良心和他的过去一起封印在了一份保密协议里。
离职那天,HR退还了他的工牌、笔记本电脑和门禁卡。工牌上的照片还是两年前入职时拍的,那时候他还有点婴儿肥,笑容明亮,眼神清澈。两年后的他,瘦了十斤,眼窝深陷,笑容里带着一种他以前从未有过的疲惫。
他把工牌收进口袋,走出了那栋他加了两年夜班的写字楼。大堂里还挂着陈海文的荣誉墙——“中国金融科技十大领军人物""最佳企业公民""数字普惠金融创新奖”。他看了看那些奖牌,突然觉得它们像一排墓碑,上面刻的不是名字,是那些被他的算法标记为”可接受损失”的人。
他摇了摇头,走出了大门。
七、回乡
离职后,他没有立刻找工作。他回了趟湖南老家,看望了母亲的墓地。
母亲在他读大二那年去世,胰腺癌。从确诊到离世,只有三个月。治疗花了二十多万,大部分是借的。父亲在母亲去世后第二年也走了,心脏病,也是治不起的那种病。他从小被外婆带大,对父母的概念是模糊的——他们每年过年才回来一次,待几天就又走了。
他站在母亲的墓前,墓碑上刻着”林门陈氏”,旁边是父亲的名字。他把一束白菊放在墓前,然后蹲下来,用手摸了摸墓碑上的字。
“妈,“他轻声说,“我做了两年很后悔的事。”
他不知道该怎么说下去。两年的工作经历像一块石头压在他心里,沉甸甸的。他想跟母亲说说那些他见过的面孔——贵州山区的那个农户,四川的那个中年男人,凌晨三点在借贷App之间切换的外卖员。他想说说那些他从未谋面的”信用白板”用户如何在算法的盲区里挣扎求生。
但他更想说的是:妈,我在做的事,跟当年那些借钱给我妈治病的人,有什么区别?
他想起母亲生病那年,外婆四处借钱的样子。外婆一辈子不向人借钱,但为了救女儿的命,她还是开口了。她找遍了全村,最后从村里的信用社贷了两万块,月息一分二。那笔钱最后没还完——母亲去世的时候,还有八千块的利息没清。
外婆没有抱怨。她只是每年清明给母亲烧纸钱的时候,会多烧两份,一份给母亲,一份给那笔没还完的债。
“阴间的债也要还。“外婆说,“人走了,账不能走。”
林晓川蹲在墓前,沉默了很久。
他想起外婆临终前说的那句话:“世间万物都有数。欠了的,要还。记不住的,要有人记。”
他欠了什么?他欠的是那些被他用正态分布遮蔽的真实的人。那些人的故事没有出现在任何报告里,没有被任何指标衡量,只是在数据库里变成了一串沉默的数字。他记住了吗?他记住了。但他的”记住”只是把他们的ID存进了某个备份硬盘里,而他们的人生已经被他的算法改写了。
他能为他们做什么?
他在墓前坐了很久,直到太阳落山。
八、种地
从湖南回到杭州后,林晓川在富阳租了一块地,种起了菜。
他跟朋友说想”休息一段时间”,朋友们都觉得他疯了——一个浙大计算机硕士,年薪五十万的风控算法工程师,辞职去种地?
但他真的开始种地了。他租了两亩地,种了茄子、辣椒、青菜、番茄,还有一小片水稻。他每天早上五点起床,扛着锄头去地里,除草、施肥、浇水、打虫。他不懂种地,就买了十几本农业技术书,在B站上找教学视频,照着学。
他的手指磨出了老茧,手臂晒成了古铜色。他的邻居是一个六十多岁的老农,姓郑,杭州本地人,以前是菜农,现在地都被征走了,只剩这一点点自留地。郑大爷看他种地的样子,笑了:“你这哪里是种菜,你这是在修行。”
林晓川问:“修什么行?”
郑大爷说:“修慢。城里人什么都要快,快到后来自己都不知道自己在干什么。你来种种地,就知道了——菜要慢慢长,人要慢慢活。”
林晓川觉得郑大爷说得对。他种地的那几个月,是他这两年来内心最平静的时期。每天的劳作是具体的、可触摸的——他流下的每一滴汗,都转化成了菜叶子上的那一点绿色。他不再需要面对那些让他窒息的数字,不再需要解释那些他自己都不相信的模型指标。
但他依然会想起那些面孔。
那些在数据流里浮沉的光点,那些被算法遗忘的人,那些在凌晨三点还不起床的绝望。
有时候在地里干活的时候,他会突然停下来,望向北方的天际线。那边是杭州的方向,是潮汐金融总部的方向,是无数互联网公司和金融科技平台的方向。他知道那些高楼里此刻灯火通明,无数像他以前一样的年轻人正在写代码、做模型、上线新版本、优化新指标。
他们会不会也在某一天,站在自己建起的系统面前,突然意识到自己建的是什么?
他不知道。
但他开始写东西了。
每天晚上,他在租来的农民房里打开电脑,开始写他这两年的经历。不是学术论文,不是工作汇报,是一种很私人化的写作——他写他见过的那些用户,写他的算法如何决定了一个贵州农户能否借到钱,写那个四川男人的母亲是如何被催收电话气得心脏病发作,写那些他从未谋面的”信用白板”用户如何在算法的盲区里挣扎求生。
他把这些文字发在一个没有人看的公众号上,每篇阅读量不超过五十。他不在乎。他写这些,不是为了给人看,是为了记住。
因为外婆说过:“记不住的,要有人记。”
他要做那个记住的人。
九、崩塌
2021年秋天,潮汐金融的危机终于全面爆发。
监管层的整改要求越来越严格,平台上的新用户增速开始放缓,而那些存量贷款开始大量逾期。公司的现金流出现了严重问题——新进来的资金不够偿还到期的债务,而银行收缩了授信,股东们也开始观望。
陈海文开始寻找接盘侠。据说他接触了七八家投资机构,但没有一家愿意在这个时候接手这个烫手山芋。有人开始传出陈海文已经跑路的消息,虽然后来被公司辟谣了,但投资人的信心已经开始动摇。
林晓川每天都会刷一下潮汐金融的App,看看那上面的数字。那些数字还在跳动——还有人在借钱,还有钱在流出,只是流出的速度越来越快,流入的速度越来越慢。
十月底,潮汐金融正式宣布”良性退出”。公告里说,公司将”有序清退存量业务,全力保障用户权益”。公告最后有一行小字:“本公告最终解释权归潮汐金融所有。”
林晓川看着那行小字,苦笑了一下。
“最终解释权”——这大概是整个互联网金融行业最讽刺的五个字了。它意味着所有的规则都是平台定的,所有的解释都是有利于平台的,所有亏损都是用户的,所有利润都是平台的。这是教科书级别的”赢家通吃”。
但更让他心寒的是另一件事。他听说,潮汐金融在”良性退出”之前,已经把最好的资产转移走了——通过一系列复杂的关联交易,把钱打到了几个离岸公司名下。那些账面上显示的”待清退金额”,实际上已经没有多少可以兑付了。
他又去找了一遍老周。
老周住在一个更偏僻的小区里,是那种九十年代的老公房,没有电梯,楼道里贴满了各种小广告。老周给他开门的时候,林晓川差点没认出来——老周瘦了整整一圈,头发白了一半,但眼睛还是那种温和而坚定的光。
“小林,你来了。“老周说,“我就知道你会来。”
林晓川问:“您的钱,现在怎么样了?”
老周说:“还了六万。剩下的,说是在三年内分期还清。但我算了算,按这个还款节奏,等还完的时候,通胀早就把钱的购买力吃光了。”
林晓川问:“您恨吗?”
老周笑了——不是苦笑,是一种很奇怪的笑,像是早就想通了什么。他说:“小林,你知道我这辈子最后悔的是什么吗?”
林晓川摇头。
老周说:“不是我投了那五十万。是我明知道那是一个击鼓传花的游戏,我还是进场了。我不是不知道风险,我只是觉得自己不会是最后一个接花的人。我贪,我侥幸,所以我输。这是我的债。”
林晓川看着老周的脸,突然想起他第一次见到老周时的样子——那个时候老周坐在公园的长椅上,捧着笔记本电脑,眼睛里有一种他无法形容的东西。现在他知道那是什么了——那是认命之后的平静。不是绝望的认命,是承担的认命。
老周认了。但那些没有”认”的资格的人呢?那些被算法判定为”信用不足”的人,那些连进场资格都没有的人,他们能认什么?他们连赌的机会都没有,就被算法拦在了门外。
林晓川在老周家坐了一下午。他们聊了很多——聊老周以前的工作,聊老周的女儿,聊老周现在重新找的一份保安的工作,月薪三千五,不够还债,但够活着。
林晓川问了一个他一直想问的问题:“老周,您觉得我做的是对的吗?”
老周看着他,想了很久,说:“小林,我不评价你的对错。我只告诉你一件事。我这辈子见过很多种人,有好人,有坏人,有聪明人,有笨人。但有一种人,是我最佩服的——做错了事,敢认,认完之后,还往前走。不因为认了就一蹶不振,也不因为要往前走就假装自己没做错。这种人,我叫他’真人’。”
林晓川在老周家的小区门口站了很久。秋风刮过,落叶在脚边打着旋儿。他看着小区里那些九十年代建的老楼,阳台上晒着被子,窗台上摆着花——那都是普通人过日子的地方,是算法永远不会看见的地方,是那些”信用评分”和”风险定价”覆盖不到的地方。
他想:我不是”真人”。我做错了事,我没有认,至少没有当众认。我选择了辞职、逃避、躲到地里去种菜。我以为不看了就可以假装没有发生。但那些债务还在,那些面孔还在,那些在数据流里游荡的光点还在。它们会一直在,直到有人记下它们的名字。
十、还债
2022年春天,林晓川决定做一件事。
他去了贵州。
不是为了调查,不是为了取证,而是为了去找一个人——那个在潮汐金融借了五万给孩子治病的黔东南农户。那个人的信息他还留着,是他当年在做风控报告时特意记下的。他当时也不知道为什么要记下来,也许是想给自己留一个证据,也许是觉得总有一天要去看看。
他从杭州坐高铁到贵阳,从贵阳坐绿皮火车到凯里,从凯里坐乡镇巴士到一个叫”排羊”的乡镇,从排羊徒步走了十五公里的山路,终于在傍晚时分找到了那个寨子。
寨子很小,只有十几户人家,都是苗族木楼。他找到那户人家的时候,男主人正蹲在门槛上抽旱烟,看到陌生人,眼神里有一种警惕。
林晓川说:“大哥,我是潮汐金融的。”
男人没有说话,只是把烟锅在地上磕了磕,站起来,把他让进了屋里。屋里很暗,墙上挂着一串玉米,地上放着一筐土豆,角落里有一张床,床上躺着一个孩子——十五六岁的男孩,脸色蜡黄,瘦得像一根柴火棒。
“这是我儿子。“男人说,“去年做了手术,今年又犯了。”
林晓川不知道该说什么。他站在那里,脑子里全是他自己写的那些代码——那些权重、那些阈值、那些被他用正态分布标准化的变量。他想起自己当初在审批这笔贷款时,看到的只是屏幕上的一个数字:五万块,年利率15.4%,十二期,等额本息,每月还款额四千五百块。
他从来不知道,这五万块意味着什么。
他从来不知道,这四千五百块意味着一个黔东南山区农民半年的收入。
他从来不知道,那个躺在床上的孩子,在算法的语言里,只是一个”信用评估对象”,一个”风险定价参数”。
男人给他倒了一碗茶,没有糖,有一股烟熏味。男人说:“这笔钱,我没还上。但我不赖账。我跟平台说了,每个月还五百,分十年还清。平台的人说不行,说要么一次性还清,要么就走法律程序。我说我没有一次性还清的能力,走法律程序我认。但我儿子还要治病,我不能把所有的钱都拿去还债。我留了五百块给我儿子买药,剩下的我全还给平台。”
林晓川问:“平台怎么说?”
男人苦笑了一下:“平台把我起诉了。法院判我还本金加利息,一共五万七。我现在每个月工资两千三,还五百给平台,还五百给我儿子买药,我自己留三百吃饭。我知道这是赖账,但我是真没办法。我唯一能保证的是,这辈子我还不完,我儿子接着还。”
林晓川沉默了很久。最后他说出口的是:“大哥,这笔钱,我来还。”
男人看着他,眼神里有一种复杂的表情——不是愤怒,不是感激,是一种说不清道不明的东西,像是早就看透了一切。
男人说:“你是哪门子的?你凭什么还?你又不是平台的人。”
林晓川说:“我是做那个模型的人。”
男人沉默了很久。最后他说了一句话,林晓川这辈子都不会忘记:
“那你更应该好好活着,把你们做的那些事写下来,告诉后人,让他们别再走这条路。这比还钱重要。“
十一、名字
从贵州回来的路上,林晓川做了一个决定。
他不再种地了。
他回到了杭州,在城西租了一个小办公室,开始写他的书。他要写他这三年的经历,写潮汐金融从成立到崩塌的全过程,写那些被他的算法遮蔽的人,写那些在数据流里游荡的亡魂。
他给自己的书写了一个名字:《数据之墓》。
书写了三个月。写完之后,他没有去找出版社。他把这本书的手稿打印了出来,厚厚的一摞,有四十多万字。然后他坐车去了湘江边上,找了一块空地,把手稿烧了。
烧的时候是黄昏,江风吹过来,把那些纸灰卷起来,在空中打旋。他蹲在江边,看着那些纸灰一点一点变成灰烬,消失在空中。
外婆以前说过:“烧给亡魂的东西,要烧透了才行。烧不透,他们收不到。”
他想:这本书烧不透,那些名字他的算法里的人收不到。
但他后来明白了,外婆说的”烧透”,不是物理意义上的燃烧,是时间意义上的——是要让那些名字被记住,被传递,被一代一代人传下去。纸会被烧掉,但文字可以被记住。人的记忆是有限的,但人类的记忆是无限的。
所以他没有把书烧掉。他把手稿收了回来,重新整理,准备找一家出版社自费出版。
他把手稿交给了杭州一家小型出版社的总编辑。那是个四十多岁的女人,姓吴,早年是写小说的,后来转型做出版,说话直来直去。她看完手稿后,跟林晓川说的第一句话是:“这本书,可能出不了。”
林晓川问:“为什么?”
吴编辑说:“因为你说的是真话。真话在这个时代是最难出版的东西。”
林晓川问:“那您还出吗?”
吴编辑沉默了一会儿,然后说:“我先帮你审稿。能不能出,我审完再说。”
审稿花了三个月。吴编辑给他提了很多修改意见,有些是技术性的——某些数据需要核实,某些时间线需要对得上;有些是文学性的——某些段落太啰嗦,某些章节的节奏有问题;但更多的是法律性的——某段描写涉及对具体人物的影射,某章内容可能涉及商业机密,需要做脱敏处理。
林晓川一条一条地改。他改了五稿,最后终于达到了吴编辑的要求。
2023年春天,《数据之墓》正式出版。首印三千册,定价四十八元,在网上书店上架后,三天之内卖完了首印,又加印了两千册。
销量不算好。但有人开始讨论这本书了。
第一个写书评的是一个财经博主,在微博上有五十万粉丝。他写了一篇三千字的书评,标题是:《一个算法工程师的良心忏悔录》。书评里说:“这本书不是一本技术书,也不是一本商业书,它是一本关于良心的书。它让我们看到了,在那些冰冷的数字背后,有多少真实的人生被改写、被压垮、被遗忘。”
第二个写书评的是一个法律学者,在知乎上发表了一篇分析文章,标题是:《从潮汐金融看互联网金融平台的系统性风险与监管漏洞》。文章从法律角度分析了潮汐金融的商业模式,指出了其中的多处违规之处,并呼吁加强对互联网金融平台的监管。
第三个写书评的是一个贵州的乡村教师,在豆瓣上发了一段很短的书评,只有两百多字。她说:“我看了这本书,想起了我们学校门口那个小卖部的老板娘。她去年在网贷平台上借了三千块钱给孩子交学费,最后滚成了两万。她男人跑了,她一个人带着三个孩子,最小的那个才两岁。她跟我说:‘老师,我不是想赖账,我是真的还不起。‘我看了这本书才知道,原来那个老板娘不只是贪心或者不懂事,她是被一套算法精准地算计了。”
林晓川看着这些书评,哭了。
他不知道自己为什么会哭。也许是因为那些文字终于被人看见了,那些他记了三年的名字终于被人念出来了。也许是因为外婆的那句话终于应验了——“记不住的,要有人记”。他记住了,他写下来了,现在别人也记住了。
十二、算法之后
2025年,林晓川回到了学校。
不是回到浙大——他离开了那个曾经培养他的母校,而是回到了一所技术学院,在那里教计算机。他的课很受欢迎,不是因为他讲得好,而是因为他讲的东西是真的。
他教的是机器学习,但他从来不只讲算法。他会在第一节课上问学生一个问题:“你们写的代码,会决定谁能够借到钱,谁会失去房子。这个问题你们想过吗?”
大多数学生没有想过。他们学的是技术,是模型,是准确率和召回率。他们从来不觉得自己写的代码会和”人”产生什么关系——他们只是在一堆数据上做优化,目标函数是AUC值,是逾期率,是利润率。
林晓川在第一节课上会给他们讲一个故事:
“我以前在一个互联网金融公司工作。我们的工作是建模型,预测用户会不会逾期。模型建得很好,AUC值0.78,在行业内算顶尖水平。我们用这个模型决定了成百上千万人的贷款申请。有些人借到了钱,有些人被拒绝了。没有人告诉他们为什么——因为算法的解释是不透明的,没有人能向一个农民解释什么叫’特征变量的标准化处理’。
“我离开那家公司之后,有一次去贵州出差,在山里遇到一个农户。他借了五万块钱给孩子治病,最后还不起,被起诉了。我看了他的数据——他在我们的评分系统里只有三百多分,属于’信用不足’群体。但我跟他聊了一个下午,我知道他的信用不是三百多分可以衡量的。他每天早上五点起床种地,晚上十点才睡,一年到头没有休息一天。他借的钱每一分都花在孩子的病上,从来没有乱花过。他不是信用不好,他只是没有被看见。
“从那以后,我在给我的学生上课的时候,我总是会问他们一个问题:你们写代码的时候,有没有想过,在你们优化的那个目标函数背后,有多少真实的人?”
学生们听得很安静。有时候,林晓川能看到有些学生的眼眶里有什么东西在闪动——他不知道那是泪光还是别的什么,但他知道,那是一个开始。
十三、潮汐
2025年夏天,潮汐金融的清退工作终于结束了。
官方公布的数据是:平台累计交易规模超过八百亿,涉及用户超过三千万人,最终清退比例约为待还余额的23%。也就是说,十个人里,有七个人的钱没有完全拿回来。
陈海文没有坐牢——他在”良性退出”前已经完成了资产隔离,个人名下没有任何可执行的财产。那些投资人的钱,通过复杂的关联交易,最终流向了几个离岸信托基金。陈海文的律师在社交媒体上发表了一份声明,说陈海文”对平台的发展历程深感遗憾,但对最终的清退结果表示认可”。
林晓川看到这份声明的时候,正在学校的食堂里吃饭。他放下筷子,对着手机屏幕看了很久,然后默默地关掉了浏览器。
他想起外婆说过的话:“欠了的,要还。“他突然觉得这句话在这个时代有了一层新的含义:欠了的不一定会还,因为规则是强者制定的,而强者有的是办法把自己的债务变成别人的损失。
但他也想起老周说的话:“真人做错了事,敢认,认完之后,还往前走。”
所以他没有停下来。他继续上课,继续写文章,继续在每一个可能的地方讲述他的故事。他知道一个人的声音很微弱,就像在海啸里扔石子。但他还是相信:只要有人在说,只要有人在记,总有一天,那些被算法遮蔽的人会被看见。
那个秋天,他又去了一趟贵州。
不是去排羊——那个寨子他已经去过两次了,每次去他都会给那个农户留两万块钱,让他们给孩子买药。他去的是一个更偏远的乡镇,那里有一个他在书里写过但从未亲自去过的地方。
那个地方在地图上只是一个点,没有任何标注。它在贵州省黔南布依族苗族自治州的最深处,要坐四个小时的班车才能到达。那里住着三十多户人家,大多数是苗族。他们没有自来水,没有网络信号,只有一口井和一片山。
林晓川站在村口,看着那些木头房子和屋顶上冒出的炊烟。他看到几个孩子在院子里玩耍,看到老人坐在门槛上晒太阳,看到年轻的女人在井边洗衣服。一切都很平静,很普通,像是被时间遗忘的地方。
他想:这些人在我们的经济数据里是”不存在”的。他们没有银行卡,没有征信记录,没有社保,没有纳税证明。如果让他们来申请贷款,他们连”信用评估”的门槛都摸不到——因为他们根本没有被评估的资格。
算法看不见他们。金融看不见他们。整个互联网时代的红利,都与他们无关。
但他们依然活着。在那片被所有人遗忘的土地上,他们依然活着,日出而作,日落而息,娶妻生子,养老送终。他们的债务只有一种:土地和天气。丰收了,多吃一口肉;歉收了,少买一件衣裳。这就是他们全部的金融生活。
林晓川站在村口,看了很久。然后他拿出手机,拍了一张照片——那是他第一次用手机给这些”看不见的人”拍照片。
他把这张照片发给了他的学生们。他在配文里写:这是算法永远不会看见的地方。这也是我们最应该看见的地方。
十四、数字
2026年春天,林晓川出了一趟远门。
他去了北京,去见了一个在互联网金融监管部门工作的朋友。朋友姓赵,是他在浙大的师兄,比他早毕业十年,现在是银保监会的一名处长。
他们在三里屯的一家咖啡馆见面。赵师兄穿着一件深灰色的羊绒大衣,戴着一副金丝眼镜,头发梳得一丝不苟,看起来完全是一个典型的京城官员的模样。但当他开口说话的时候,林晓川又看到了当年在浙大图书馆里那个意气风发的师兄的影子。
“你的书我看了。“赵师兄说,“《数据之墓》。写得不错。”
林晓川问:“您觉得写得对吗?”
赵师兄沉默了一会儿,说:“对不对不好说。但你写的那些事,我都知道。我们监管层面的人,其实一直都知道问题在哪里。只是知道归知道,改归改。这两件事之间,隔着很多很多东西——利益、政绩、人情、惰性,还有一套运转了几十年的体系。”
林晓川问:“那您觉得能改吗?”
赵师兄端起咖啡杯,喝了一口,然后说:“我不知道。但我知道一件事——如果所有人都选择沉默,那就永远改不了。只有有人站出来说,把问题摆到台面上,公众才会知道,知道了才会推动,推动了才会改变。你做的事,意义就在这里。”
林晓川点了点头。他没有说什么谦虚的话——因为赵师兄说的是对的。他做的事,意义不在于他还了多少钱,也不在于他的书写得好不好,而在于他记住了,他把那些被算法遮蔽的人的名字,记在了纸上,记在了书里,记在了这个世界的某个角落。
那天晚上,林晓川坐上了回杭州的火车。
车窗外的华北平原一片漆黑,只有偶尔的灯火点缀其间,像是大海里的渔火。他看着那些灯火,突然想起他第一次在凌晨的公交车上看到那些浮动光点的情景。
他想起外婆说的”过阴”。外婆说,阴阳交界的地方,阴气最重,活人可以看见亡魂。
他想:互联网金融大概就是这个时代的”阴气最重的地方”。那些被算法遮蔽的人,被债务压垮的人,在算法的另一边游荡——他们的名字在数据库里,他们的命运在代码里,但他们自己,却被整个系统”不可见”了。
他的工作,就是把这种”不可见”变成”可见”。把那些沉默的数字,还原成真实的人。把那些被正态分布遮蔽的绝望,放到阳光下来晒一晒。
火车在夜色中疾驰。他闭上眼睛,感觉自己像是在穿越一条很长很长的隧道。隧道的尽头有一点光,那光是暖色的,是阳光的颜色。
他想:外婆,如果您能看到这些,您会怎么说?
外婆大概会说:川儿,你终于记了。
尾声
2026年4月,杭州的雨季又来了。
林晓川在技术学院的办公室里批改作业。窗外的雨打在梧桐叶上,发出沙沙的声音。他的桌上放着一杯茶,茶已经凉了,但他没有换——他总是这样,一忙起来就忘记喝茶。
他批改的是一份课程设计报告,题目是”信用评分模型的公平性分析”。这是他今年新开的一门课,要求学生不仅会建模型,还要学会审视模型的偏见和局限。
报告里有一个学生的观点让他印象深刻。那个学生写道:
“信用评分模型的设计者假设,高消费频次代表高还款能力。但这个假设本身就是一种阶层偏见——因为高消费频次可能只是意味着一个人居住在城市化程度较高的地区,或者从事着需要高频消费的工作(如外卖骑手、快递员)。这些人往往收入不稳定,但他们必须维持高消费才能维持基本的生活水平(因为他们住在城市里,城市的消费结构决定了他们无法像农村居民那样自给自足)。因此,消费频次这个变量,实际上是在用城市中产阶级的标准来评判所有人——它的背后是一种隐性的阶层歧视。”
林晓川在报告上写了一个”优”字,然后在旁边加了一句批注:“你的思考方向是对的。更进一步,你应该问:谁设计了这些变量?谁决定了权重?谁从这个设计里获益?记住:每一个算法偏见背后,都站着一个权力结构。”
他放下笔,走到窗边,看着窗外的雨。雨越下越大,梧桐叶在风雨中摇晃,像是在跳一支无序的舞。
他想起三年前的那个雨夜,他第一次在公交站台看到那些浮动的光点。那时候他以为那是幻觉,以为是自己太累了产生了错觉。现在他知道,那不是幻觉——那是外婆说的”过阴”。是那些被算法遮蔽的人,在债务最重的地方,以最微弱的方式,向这个世界发出的一声叹息。
他想起老周说的话:“真人做错了事,敢认,认完之后,还往前走。”
他想起贵州那个农户说的话:“把你做的那些事写下来,告诉后人,让他们别再走这条路。这比还钱重要。”
他想起赵师兄说的话:“只有有人站出来说,把问题摆到台面上,公众才会知道,知道了才会推动,推动了才会改变。”
他想起外婆临终前说的话:“世间万物都有数。欠了的,要还。记不住的,要有人记。”
他一直记着。
雨还在下。他回到桌前,继续批改作业。窗外,一道闪电划过天空,把整个天空照得雪亮。在那一瞬间,他觉得整个世界都像是被照亮了——那些被算法遮蔽的角落,那些被数字淹没的名字,那些在数据流里游荡的亡魂,都在这一刻短暂地显形。
然后雷声响起,一切又归于黑暗。
但林晓川知道,它们还在那里。在数据的深处,在代码的缝隙,在算法的盲区,它们一直在那里——等待被看见,等待被记住,等待有人为它们说一句:你们不是参数,你们是人。
这是外婆教给他的最后一课,也是他用余生去实践的一件事。
窗外的雨渐渐小了。阳光从云缝里漏下来,在水洼里碎成无数光点。那一刻他有种奇怪的感觉——他觉得自己不是一个人,身后还有无数道目光,从数据深处望向他。
林晓川没有回头。
他继续批改作业。
(全文完)