数字分子
数字分子
一、分数
陈望海三十五岁那年,收到了一份特殊的生日礼物。
礼物装在一个牛皮纸信封里,没有寄件人地址,只有一个红色的官方印章。他拆开信封的时候,手微微发抖—不是激动,是恐惧。在这个时代,官方来信很少是好消息。
但当他读完信上的内容,恐惧变成了另一种东西,一种更深的、冰冷的茫然。
“陈望海先生,您的社会信用评分已由系统自动评定为B+级。依据《城市信用分级管理办法》第七条,B+级及以上居民可享受以下权益:优先就医、子女就读重点学校、购房贷款利率下浮10%…B级以下居民需接受以下限制:限购两套房产、限制高消费、纳入重点监管名单…”
他从头到尾读了三遍,然后在最后一页的右下角看到了自己的分数:687分。
比三个月前低了41分。
他没有抽烟的习惯,但那天晚上他在阳台上站了很久,看着楼下那条永远在施工的马路,路灯把一切照得像白昼,尽管已经是凌晨一点。他的手机每隔几分钟就震动一次—应用推送,他早就关掉了大部分通知,但有一个App关不掉,那就是”城市信用”。
这个App是政府强制安装的。
陈望海把信封折好,放进抽屉里。他知道那41分去了哪里。三个月前的那件事,他没有主动申报。按照规定,任何涉及公司经营异常的信用事件,当事人都应该在七个工作日内向主管部门主动报告。但他选择了沉默。
他以为自己可以瞒过去。
但他忘了一件事:这个城市的每一笔交易、每一次出行、每一条网络发言,都被某种无形的东西记录着。他只是不确定那东西究竟是一个中心化的数据库,还是某种分布式的、渗透进生活每个毛孔的感知网络。技术部门的同事私下里叫它”蜃景”—一种像海市蜃楼一样无处不在又难以捉摸的存在。
他关上阳台的玻璃门,走回客厅。妻子林小婉已经睡了,卧室的门虚掩着,从门缝里透出一线台灯的光。他知道她还在等自己,但她太累了,总是等不到就先睡着。
他轻手轻脚走到厨房,从冰箱里拿出一瓶啤酒。拉开拉环的声音在寂静中显得格外响亮。
他想起了三年前,刚从北京回来的时候。
那时候”城市信用”系统刚刚上线试运行,官方说法是”建设诚信社会,提升治理效能”。他在一次人才引进的招聘会上看到了这个项目,招聘方是一家听起来很普通的国有企业—城信数据技术有限公司。面试他的是个四十多岁的女人,戴着黑框眼镜,说话慢条斯理,但眼神很锐利。
“陈先生,我们注意到您在数据挖掘和机器学习方面有很深的积累,“她说,“这个项目需要的是既有技术能力又有大局观的人才。”
“大局观”这个词让他后来想了很久。他当时并不完全理解那是什么意思。他以为那只是一个面试中的套话,就像所有招聘广告里写的”希望你热爱公司”一样。
现在他知道不是了。
二、数据的河流
陈望海的工作地点在城市的边缘,一个叫”数字谷”的科技园区。官方资料显示,这里汇聚了三十多家高新技术企业和六家科研院所。但真正让数字谷出名的是另一件事:它也是”城市信用”系统的数据中心所在地。
每天清晨,陈望海会从家里出发,步行十分钟到地铁站。刷卡进站的时候,闸机会发出一个轻微的”滴”声,同时他的手机会震动一下—城市信用的App会在后台自动记录他的出行数据。他在地铁上摇晃四十分钟,在”政务中心站”下车,再步行五分钟到达公司大楼。
这套流程他重复了三年,每一天都一样。但最近,他开始注意到一些以前从未留意的细节。
比如地铁上的广告屏。以前那些屏幕播放的是商品促销、电影宣传、选秀节目,但现在他发现,广告的内容变了。屏幕上反复播放的是各种”信用评分提升方法”和”信用之星评选活动”。一个穿着制服的女主持人笑容可掬地说:“信用点亮生活,诚信铸就未来。市民朋友们,您的每一次守信行为,都在为城市的文明建设贡献力量!”
他旁边的座位上,一个中年男人正低头看手机。陈望海瞥了一眼他的屏幕—是城市信用的App界面,上面显示着他的分数:742分,比陈望海高了整整55分。那个男人似乎正在浏览一个”信用权益”页面,脸上带着一种奇怪的满足感。
陈望海移开视线,看向车窗外。隧道里漆黑一片,只有零星的检修灯一闪而过。他突然意识到,在这样的黑暗中,其实什么都看不见。
到公司之后,他刷卡进门。大厅里立着一块巨大的电子屏幕,实时显示着城市信用的各项指标:今日新增数据条目、市民平均信用评分、信用优良率、信用惩戒执行情况…屏幕底下有一行小字滚动播放:“数据来源:城市信用信息共享平台 | 更新周期:实时”。
实时。这意味着他的每一次刷卡记录,都在被即时传输、即时处理、即时计入他的评分。
他的工位在六楼,技术部六组。办公区是一个开放的大空间,两百多个工位整齐排列,像蜂巢的每一个格子。他坐到自己的位置上,打开电脑。屏幕上弹出一个密码框,他输入密码,然后是指纹验证,然后是人脸识别。三重验证完成之后,桌面才显现出来。
桌面上有一个他再熟悉不过的图标—“蜃景”。
这是他们部门对城市信用核心系统的内部代号。官方名称是”城市社会信用信息管理平台V3.0”,但技术部门的同事私下里只叫它蜃景。
“蜃景”的架构分为三层:数据采集层、分析计算层和应用输出层。陈望海所在的组负责的是中间层—分析计算层的模型训练和算法优化。具体来说,他的工作是用机器学习算法,让系统能够更准确地评估每个人的信用分数。
“准确”这个词,在内部文件中被反复强调。但陈望海知道,“准确”是一个极其模糊的概念。什么才是准确的信用评估?按时还款算准确吗?捐款算准确吗?发表爱国言论算准确吗?在公园不乱扔垃圾算准确吗?
这些问题从来没有被正式讨论过。但它们像幽灵一样游荡在部门的每一次技术评审会上。
九点整,部门开晨会。主持会议的是组长周海文,一个四十出头、头发稀疏但身材壮硕的男人。周海文是从部队转业的,据说以前是总参某部的技术军官,转业之后直接分配到了现在的单位。他不懂技术,但他懂管理—或者说,他懂怎么让上面满意。
“今天有几个事情通报一下,“周海文站在投影幕前,表情严肃,“第一,本月系统要进行一轮版本升级,主要优化的是数据采集的覆盖范围。市场监管局和民政局的数据接口已经打通了,从下周开始,个体的经营行为和婚姻状态也会纳入评估体系。这是市里领导亲自抓的项目,必须按时完成。”
陈望海低头在本子上记着。他旁边的同事李明辉凑过来,压低声音说:“又加了数据源?上次加完我的模型跑了三天都没收敛。”
“忍着,“陈望海说,“领导说要准时,那就得准时。”
周海文继续说:“第二件事,关于数据质量。上周审计部抽查的时候发现,有些区的数据采集存在漏报、迟报的情况。领导很不满意,要求我们技术组配合运维组,对各区的数据采集终端进行一次全面巡检。重点是城西和城南两个区,上次被点名了。”
城西和城南。陈望海在这两个区的名字下面画了一道线。城西是老的工业区,近几年在搞产业升级;城南是城乡结合部,大量外来人口聚集。这两个地方的数据采集确实比较复杂—不是因为技术问题,而是因为那里有太多”灰色地带”。
什么样的灰色地带?简单来说,就是那些无法被量化的行为。
比如一个人帮助邻居照看孩子,算不算”互助行为”,能不能加分?比如一个小贩在路边摆摊,卖的是自己种的菜,算不算”合法经营”?比如一个人在家里给远方的父母转账,算不算”孝老爱亲”?
这些行为在现实中每天都在发生,但在数据系统里,它们要么无法被记录,要么被粗暴地归类到某个标签下,要么干脆被忽略。
陈望海曾经向周海文提过这个问题。周海文的回答是:“技术上的事,我们想办法解决。但首先你得承认,这些行为在系统里是可以被建模的。关键是看你怎么定义特征。”
怎么定义特征。这句话说起来容易,做起来却无比艰难。因为每一种定义背后,都隐藏着一种价值判断。而价值判断,从来就不是纯粹的技术问题。
三、数字幽灵
下午三点,陈望海被叫到了周海文的办公室。
周海文的办公室不大,但收拾得很整洁。墙上挂着一幅字:“數據為本”。陈望海第一次进来的时候,觉得这幅字写得很好。后来他听说这幅字是周海文自己写的,就再也不觉得好了。
“坐,“周海文指了指办公桌前的椅子,“有个事想跟你聊聊。”
陈望海坐下,等着周海文开口。
周海文沉默了几秒钟,似乎在斟酌措辞。然后他说:“望海,你来咱们单位多久了?”
“三年整。”
“三年,不短了。“周海文点点头,“你对蜃景系统,应该说比我更了解。”
陈望海没有接话。他等着。
周海文继续说:“是这样…最近市里有个重要的检查,是关于系统运行情况的。领导想看看我们数据分析这一块能不能拿出一些有说服力的成果。具体来说,就是能不能展示一下信用评分对市民行为的引导效果。”
“引导效果?”
“对。比如有没有这样的案例—某个信用分数较低的市民,在系统的激励下提升了分数,同时他的社会行为也变得更规范了。这种正向改变的案例,最能说明问题。”
陈望海明白了。周海文想要的是一种”成果展示”,一种能够证明系统有效的证据。这种证据在技术上不难找到—只要从数据库里筛选出一些分数提升的案例,然后做一些相关性分析就行了。
但陈望海心里有一个声音在问:这些案例真的能说明问题吗?分数提升和社会行为改善之间,真的有因果关系吗?还是只是一种巧合?
他没有把这些问题说出来。他知道,有些问题是不适合问的。
“明白了,“他说,“我来安排。”
周海文的脸上露出满意的神色:“好。另外还有一个事…”
他从抽屉里拿出一个文件夹,递给陈望海。
“你看看这个。”
陈望海打开文件夹。里面是一份数据报表,标题是”城西区域信用评分异常波动分析报告”。他快速浏览了一下内容,眉头渐渐皱起。
报表显示,过去三个月,城西区域有超过三千名市民的信用评分出现了异常波动。其中大部分是分数下降,少部分是分数上升。下降的原因五花八门:有的因为”经营异常”,有的因为”欠缴物业费”,有的因为”交通违章”,还有的因为”网络发言不当”。
上升的原因则比较集中:大部分是因为”积极参加社区志愿服务”或者”主动申报经营信息”。
“这些数据是真实的吗?”陈望海问。
周海文的眼神闪了一下:“技术上可能有误差,但总体趋势是可信的。”
陈望海又看了一遍报表。他注意到一个细节:那些分数上升的案例,时间节点大多集中在最近一个月—也就是系统刚刚增加数据采集点的时候。
他知道这意味着什么。
“周组长,这份报表是给谁看的?”
“当然是给领导看的。“周海文说,“市里马上要开一个信用体系建设推进会,需要各区拿出数据。城西区的数据有点不好看,区委王书记压力很大。他找了我们领导,希望技术部门能帮忙分析一下原因。”
陈望海合上文件夹。他想起了一个人。
王书记。全名王建业,是城西区的区委书记。陈望海见过他一次,是在去年的一个政务公开活动上。王建业大约五十岁出头,头发花白但精神矍铄,说话时喜欢用手势,像一个习惯了掌控局面的人。
那次活动中,王建业做了一个发言,主题是”社会信用体系建设与基层治理创新”。陈望海记得他说了这么一句话:“信用不是一个抽象的道德概念,而是一个可以量化、可以比较、可以应用的治理工具。”
当时陈望海觉得这句话说得很好。现在他开始怀疑这句话。
“分析原因没问题,“他把文件夹放回桌上,“但我想知道,我们分析的结论会不会被用来做一些…不是纯粹技术层面的决策?”
周海文的表情没有变化,但陈望海注意到他的手指轻轻敲了一下桌面。这是周海文紧张时才会有的小动作。
“望海,你是个聪明人,“周海文说,“你应该知道,有些事情不是我们能决定的。我们能做的,就是把技术工作做好。至于结论怎么用,那是领导的事。”
陈望海沉默了几秒钟。然后他说:“我明白了。”
他站起来,拿起文件夹。走到门口的时候,他停了一下,回头说:“周组长,我有个建议。”
“说。”
“这些异常波动的数据,最好做一次清洗。把那些明显受政策影响而不是自然行为导致的波动剔除掉。这样出来的结果会更客观一些。”
周海文的眼睛眯了一下:“你的意思是?”
“我的意思是,那些因为’主动申报’而加分的数据,可能需要重新审视。申报是一种行为,但它不一定是信用的体现。也可能只是因为大家知道不申报会有后果。”
周海文沉默了很久。最后他挥了挥手:“你去安排吧。具体怎么处理,你看着办。”
陈望海点点头,走出了办公室。
四、算法之网
那天晚上回家的时候,陈望海在地铁上遇到了一个人。
是一个女孩,看起来只有二十出头,穿着一件洗得发白的T恤和一条牛仔裤,背着一个旧旧的双肩包。她站在车厢的角落里,低着头看手机,屏幕的光映在她的脸上。
陈望海本来没有注意到她。但就在地铁快要进站的时候,车厢突然剧烈晃动了一下。女孩没站稳,手机从手里飞了出去,摔在了地板上。
陈望海弯腰帮她捡起了手机。屏幕朝下,捡起来的时候他瞥见了一眼屏幕上的内容—是城市信用的App,页面上显示着一个分数:523分。
这个分数在B级以下。
女孩接过手机,低声说了句谢谢。她的声音很轻,像是一片羽毛落在水面上。
陈望海回到自己的位置坐下。他看着车窗玻璃上映出的自己的脸,突然想起了很多年前的自己。
那是2018年,他还在北京读研究生。那时候P2P网贷正火,他的一个同学借了钱去炒币,结果血本无归。那个人后来消失了,据说是跑路了,也有人说他去了某个小城市隐姓埋名。陈望海当时觉得那种事情离自己很远。他学的是数据科学,他相信技术可以解决问题,可以让世界变得更透明、更公平。
现在他知道,技术确实可以让世界变得更透明。但透明不一定等于公平。有些东西被照亮,不是因为它们应该被看见,而是因为它们可以被控制。
地铁到站了。陈望海走出车厢,走进那个永远亮如白昼的地铁站大厅。他的手机震动了一下—又是城市信用的推送:“您今日的信用评分已更新,当前分数:687分,保持稳定。”
保持稳定。他苦笑了一下。这个系统从来不告诉你为什么会得到这个分数,只会告诉你分数是多少。它让你看到数字,但看不到数字背后的逻辑。
这才是它最可怕的地方。
回到家的时候,林小婉正在客厅里看电视。电视上放的是一个选秀节目的回放,但她似乎并没有在看,只是盯着屏幕发呆。
“怎么了?”陈望海换了拖鞋,走过去坐在她旁边。
“没什么,“林小婉回过神来,“就是在想一些事情。”
“什么事?”
林小婉犹豫了一下,然后说:“今天我去接孩子放学的时候,碰到悠悠的妈妈了。她说她家悠悠的信用评分被降了。”
“为什么?”
“因为她老公的公司出了点问题,好像是资金链断裂还是什么的。悠悠妈妈说,那个公司的经营异常被记录到她老公的信用档案里了,然后因为她老公是户主,所以也影响到了她的评分。最惨的是悠悠,学校说信用评分B级以下的学生家庭,在评选三好学生的时候要扣分。”
陈望海沉默了。他不知道该说什么。
“还有,“林小婉继续说,“她说她老公最近精神状态很不好。银行贷款贷不下来,供应商的货款也付不出去。他想去找区里反映情况,但区里的人说这种事不归他们管,让他们去找市场监督管理局。市场监督管理局的人说,要先等法院的判决。法院的判决还没下来,公司的账户就被冻结了。”
“这不是连坐吗?”陈望海终于忍不住说了一句。
林小婉看了他一眼:“你说这话的时候,小心点。”
陈望海愣了一下,然后点点头。他知道林小婉是好意。在这个时代,有些话是不适合说的,尤其是在家里—因为你不知道隔墙是否有耳。
那天晚上,陈望海躺在床上,睡不着。
他想起了下午那份报表里的数据。城西区域,三千多个异常波动。那些数字背后,是三千多个人的人生。有的人的分数在上升,可能只是因为他们学会了”如何让分数上升”;有的人的分数在下降,可能只是因为他们被某种自己无法控制的东西卷了进去。
他想起了三年前自己刚入职时的想法。他以为做数据分析是一件很有意义的事情—通过数据,可以发现问题,可以优化决策,可以让社会变得更好。现在他开始怀疑,这个想法本身是不是一种幻觉。
数据不是客观的。从数据采集的那一刻起,就已经带有主观性了。谁来定义”守信”?谁来定义”异常”?谁来定义”好市民”?这些定义背后,都是人的意志。而人的意志,从来就不是纯粹的。
他翻了个身,试图入睡。但那些数字像萤火虫一样在他的脑海里飞舞—687,523,742,41,3000…
五、旧友
周六上午,陈望海接到一个电话。
电话是大学同学打来的,叫赵海涛。赵海涛是他们班里最早创业的人,大三的时候就开始做网站,后来做电商,再后来做P2P。陈望海还记得,2015年前后,P2P正火的时候,赵海涛的平台据说融资了几千万。同学们都说海涛要发了,以后得抱大腿。
但后来P2P暴雷了。大量的平台跑路,大量的投资者血本无归。赵海涛的平台据说也出了事,但陈望海不确定具体是什么情况—他们已经很多年没联系了。
“海涛?怎么会突然联系我?”陈望海有些意外。
“老陈,我出事了。“电话那头,赵海涛的声音很低沉,“我现在在城南,你能不能过来一趟?”
陈望海犹豫了一下。城南是城乡结合部,治安情况比较复杂。而且他和赵海涛已经很多年没联系了,突然让他过去,总觉得有些蹊跷。
“出什么事了?”
“电话里说不清楚。你来了就知道了。“赵海涛停顿了一下,“老陈,我实在是没办法了才找你的。你是搞数据的,你能帮我。”
“帮你什么?”
“帮我证明一件事。”
“什么事?”
赵海涛沉默了很久。然后他说:“帮我证明,那个分数不是我的错。”
陈望海第二天一早就去了城南。
城南和他想象的不太一样。他以为那里会很乱,但实际上那里很热闹。街道两旁是各种各样的小店,卖菜的、卖早餐的、修手机的、贴膜的。人流熙熙攘攘,各种口音的普通话交织在一起,让他想起很多年前去过的一个县城。
赵海涛发来的定位是一个城中村的入口。陈望海按照定位走到那里,看到一排排的握手楼,楼与楼之间的间距窄得只能容一个人通过。地上堆满了垃圾和积水,空气中弥漫着一股潮湿的霉味。
赵海涛站在一栋楼的门口等他。
陈望海差点没认出来。赵海涛比大学时瘦了至少三十斤,脸上颧骨突出,眼窝深陷,看起来像是一个五十多岁的人。但他分明才三十五岁。
“海涛?你怎么变成这样了?”陈望海惊讶地问。
赵海涛苦笑了一下:“说来话长。走,上去说。”
他们沿着一条狭窄的楼梯爬到三楼。赵海涛租的房间只有十几平米,除了一张床、一张桌子、一把椅子,几乎什么都没有。窗户很小,而且被对面的楼挡住了光线,整个房间显得很暗。
赵海涛给陈望海倒了一杯水,然后坐在床边,双手抱着头。
“海涛,到底怎么回事?”陈望海问。
赵海涛沉默了很久,然后开始说。
他说起了当年的P2P创业。2015年,他的平台上线,最初只是一个简单的借贷撮合网站。后来规模越来越大,他开始做理财、做资产证券化、做供应链金融。2018年,他拿到了第一笔融资,一共两千万。
“那时候我觉得自己站在风口上,“赵海涛说,“我以为互联网金融可以改变中国几亿人的理财方式。我以为我在做一件有意义的事情。”
但2019年开始,行业开始出问题了。很多P2P平台暴雷,投资人血本无归,引发了一系列的社会事件。监管部门开始收紧政策,要求所有的P2P平台转型或者清退。
“我本来想转型的,“赵海涛说,“但转型需要时间,需要钱,需要资源。我什么都没有。我只能选择清退。”
清退的过程是痛苦的。投资人的钱要还,员工的工资要发,供应商的货款要付。赵海涛卖掉了房子、车子,把所有的积蓄都拿出来,但还是有很大的缺口。
“最难的时候,我想过去死。“赵海涛说这话的时候,语气很平静,像是在说别人的故事,“但我没有。我告诉自己,只要活着,就还有希望。”
后来,他被起诉了。罪名是非法吸收公众存款。
“我不觉得我做错了什么,“赵海涛说,“我一直都在努力还钱。但法院不这么认为。”
他被判了五年,缓刑三年。出来之后,他发现自己已经一无所有了。房子没了,车子没了,老婆带着孩子走了。更糟糕的是,他的信用记录上多了一个污点—“非法集资”。这个污点让他的社会信用评分一落千丈。
“现在我的分数是489分,“赵海涛说,“你知道这意味着什么吗?我租不了房子—房主说要查信用记录,分数太低的不租。我找不到工作—所有的正规公司都要查信用记录,分数太低的不要。我甚至连共享单车都租不了—信用分不够,连单车的免押服务都享受不了。”
陈望海沉默地听着。他不知道该说什么。
“但最让我不甘心的是,“赵海涛说,“我明明一直在还钱。我每个月都在还。我欠的债,五年之内肯定能还清。但这个系统不给我机会。它只看到我的分数,看到我的污点,然后把我判定为一个’不守信’的人。”
“你说让我帮你证明什么事?”陈望海问。
赵海涛从床底下拿出一个旧笔记本电脑,打开,放在陈望海面前。屏幕上是一个Excel表格,里面密密麻麻的数据。
“这是我所有还款记录的明细,“赵海涛说,“每一笔钱我什么时候还的,还了多少,有没有逾期,都在这里。”
他指着表格里的一个数字:“你看,从2019年到今天,我累计还款487万。我逾期的次数只有3次,而且都是因为银行转账延迟,不是我故意不还。逾期的天数最长的一次是5天。”
陈望海看着那些数字。他注意到,表格里确实有大量的”按时还款”记录,而且时间跨度很长,将近五年。
“你的意思是,“陈望海说,“这些还款记录没有反映到你的信用评分里?”
赵海涛点头:“从来没有。我的分数还是一直在降。因为系统只看到了我的污点,没有看到我的改变。”
陈望海皱起眉头。这确实是一个问题。如果赵海涛说的是真的,那说明城市信用的评分系统存在一个严重的缺陷—它只能捕捉到静态的历史记录,无法捕捉到动态的行为变化。一个五年前的污点,可以持续影响一个人五年后的评分,即便那个人已经痛改前非、一直在努力修复。
这不是一个技术问题,这是一个设计问题。
但陈望海也注意到了另一个问题。赵海涛的贷款人主要是谁?他们的信用状况如何?有没有那种借了钱就从来不还的老赖?如果有的话,他们现在怎么样了?
他问了赵海涛这个问题。赵海涛的表情变得有些复杂。
“老陈,你想听实话吗?”
“想。”
“实话就是—那些借了我的钱然后从来不还的人,现在分数比我高。”
陈望海愣住了。
“怎么可能?”
“怎么不可能?”赵海涛苦笑,“因为他从来不产生数据。”
陈望海明白了。那些老赖之所以分数高,是因为他们不和银行打交道,不产生任何正规金融的数据。他们的现金收入、社会活动、消费记录,全都在系统之外。系统看不到他们,只能看到赵海涛—一个在大数据时代留下太多痕迹的人。
“这个世界是反的,“赵海涛说,“越是想遵守规则的人,在系统里留下的痕迹越多,被评价得越严格。越是游离在规则之外的人,反而越安全。”
陈望海离开城中村的时候,心情很沉重。
他走了很远,才走到一个公交站。站在那里等车的时候,他看着对面的高楼大厦,突然觉得这个城市很陌生。
他想给赵海涛回一个电话。但他最终没有拨出去。他不知道自己该说什么—说”我会帮你”?他拿什么帮?说他理解赵海涛的处境?但他真的理解吗?
公交车来了。他上了车,找了一个靠窗的位置坐下。
车窗外的风景在倒退。高楼、工地、立交桥、绿化带…一切都在流动,像一部无声电影。
他想起了很多年前看过的一句话:“我们塑造了我们的建筑,然后我们的建筑塑造我们。“他想改一下这句话:“我们塑造了我们的数据,然后我们的数据塑造我们。“
六、蜃景
周一上班的时候,陈望海开始做那件他一直在回避的事情:研究城西区域信用评分异常波动的原因。
他调出了过去六个月城西区域的所有信用评分数据。数据量很大,光是原始数据就有几十个G。他花了整整两天时间做数据清洗和特征工程,才把数据整理成可以分析的形式。
分析的过程是枯燥的。但当他看到结果的时候,所有的枯燥都变成了震惊。
他发现了几件事。
第一件事:城西区域信用评分下降的人群中,有超过60%的人是因为”经营异常”被扣分。而这些”经营异常”,有相当比例是因为他们的小微企业没有通过年度工商年报。
为什么没有通过年报?陈望海进一步分析发现,这些企业大部分是个体工商户,员工人数在5人以下,年营业额在50万以下。他们很多是夫妻店,或者家庭作坊式的加工点。
这些人没有专业的会计,不懂网上申报流程,年报提交的时间往往错过。而且他们分布在城西的各个角落,有些地方甚至没有宽带网络。
简单来说,他们不是因为”不诚信”而被扣分,而是因为”跟不上这个时代的节奏”而被扣分。
第二件事:城西区域信用评分上升的人群中,有超过70%的人是因为”参加志愿服务”活动而被加分。但陈望海进一步分析发现,这些”志愿服务”活动,有很多是政府组织的”创文巩卫”活动—也就是创建文明城市、巩固卫生城市的义务劳动。
义务劳动当然不是坏事。但问题是,当”参加志愿服务”成为信用加分的主要来源,它就变成了一种激励工具。很多人参加这些活动,不是出于真心想做志愿者,而是为了加分。
第三件事:陈望海发现了一个他之前从未注意过的现象—城西区域的信用评分波动,与区政府的工作考核周期高度吻合。
每年三月和九月,是区政府向市政府汇报工作的时间节点。在这两个时间节点前后,城西区域的”信用优良率”会出现明显的上升。而在年中和年尾,这个指标又会回落。
这不是巧合。
陈望海把这个发现写进了报告里。他没有直接点明这意味着什么,但任何一个看懂数据的人都会明白:有人在操纵数据。
他不知道是谁在操纵,也不知道是怎么操纵的。但有一件事是确定的:这套系统的数据,并不是完全客观的。它掺杂了人为的因素,掺杂了考核的压力,掺杂了政治的需要。
他把报告发给了周海文。
周海文的回复很快:“收到。辛苦了。”
然后就没有然后了。
陈望海等了三天,没有收到任何反馈。他去问周海文,报告有没有什么问题,需不需要补充分析。
周海文的回答是:“报告我看过了,没什么大问题。我已经转发给相关部门了。”
“然后呢?”
“然后什么?”
陈望海想说的那句话咽了回去。他知道,在这种情况下,“然后”不会有任何结果。
七、暗流
事情在一个很普通的下午发生了变化。
那天是周三,陈望海正在工位上写代码。他的电脑突然弹出一个系统通知:“请注意,您的账号正在被后台进程访问。如非本人操作,请立即报告信息安全部门。”
他愣了一下,然后意识到这不是一个普通的通知。
他快速检查了自己的账号登录记录。他发现,就在十分钟前,有一个陌生的IP地址访问了他的工作账号,并且下载了大量的数据文件。这些数据文件,正是他之前做的那份城西区域信用评分分析报告。
他立刻向信息安全部门报告了这件事。
信息安全部门的人来得很慢。一个小时后,他们才派人来。来的是一个年轻的工程师,叫孙浩然,戴着眼镜,说话很客气,但表情很紧张。
“陈老师,您反映的情况我们了解了,“孙浩然说,“能请您描述一下具体的情况吗?”
陈望海把事情的经过说了一遍。孙浩然在他的电脑上操作了一会儿,然后皱起眉头。
“陈老师,您确定是被访问了?”
“确定。我有截图。”
“我看到了。但问题是…”孙浩然指着屏幕上的一个数字,“根据我们的日志,您这个账号最近三十天内没有任何外部访问记录。”
陈望海愣住了。他凑近屏幕,看到日志上清清楚楚地写着:过去三十天,该账号只有一次登录记录,时间是今天上午九点十三分,登录地点是公司内网,IP地址是正常的。
“但我刚才明明看到了—”
“陈老师,“孙浩然打断了他,“您最近是不是工作压力很大?”
陈望海看着孙浩然的眼睛。那是一双很年轻的眼睛,年轻到让他想起很多年前的自己。
“你在暗示什么?”
“我不是暗示什么,“孙浩然说,“我只是想说,有时候工作压力大,可能会出现一些…视觉上的错觉。”
陈望海沉默了几秒钟。然后他说:“好。我明白了。”
孙浩然离开之后,陈望海打开了自己的笔记本电脑。他没有用公司的电脑,而是用自己的私人设备—这是他三年前入职时养成的习惯,从来不在公司设备上保存重要的工作文件。
他在自己的笔记本电脑上找到了他之前备份的那份分析报告。报告还在。
他把报告又看了一遍。这一次,他注意到了一些以前没有留意的细节。
报告的第七页,有一个数据表格。表格里有一列是”信用评分变化与社会行为变化的相关性分析”。这个分析的结果是:相关性系数为0.23,属于弱正相关。
0.23。这意味着什么?意味着城市信用评分的变化,和市民社会行为的改善之间,只有很微弱的关系。如果系统真的有效,这个系数应该更高。
陈望海把这个数据标记出来。他有一种预感,这个数字会很重要。
那天晚上回家的时候,他绕了一个远路。他想一个人走走,整理一下思绪。
他走到一个天桥上,停下来,趴在栏杆上看着下面的车流。车子像甲虫一样在马路上爬行,车灯在夜幕中划出一道道光痕。
他突然意识到,他三年来一直在做的工作,其实是在用技术手段为一个存在缺陷的系统打补丁。他以为自己是在优化系统,但他其实是在维护系统的合法性。他让那些本该被质疑的东西,变得更加无懈可击。
就像一面镜子。他一直在擦拭镜子,让镜子里的影像更加清晰。但他没有问过一个问题:镜子里的影像,是不是真实的?
他拿出手机,打开城市信用的App。屏幕上显示着他的分数:687分。和三个月前一样。
他突然很想笑。687分。这个数字看起来很具体,很精确,但它到底代表什么?它代表他是一个”好市民”吗?它代表他是一个”守信的人”吗?它代表他的人生值得被信任吗?
没有人知道。
八、山雨欲来
四月中旬,发生了一件大事。
城南区的一个小区里,有一个中年男人从楼上跳了下来,当场死亡。
这件事本来不会引起太大的关注—毕竟,在这个城市里,每个月都有一些人因为各种原因离开这个世界。但这一次不同的是,死者的身份有些特殊。
他是一个P2P平台的前投资者。
五年前,他在赵海涛的平台上投资了二十万。那是他的全部积蓄。平台暴雷之后,他一直没有拿回这笔钱。这五年里,他靠打零工维持生计,妻子和他离婚了,孩子也不跟他来往。他住在城南区的一个老旧小区里,租的是一个单间,每个月的房租是八百块。
他跳楼之前,在网上发了一篇帖子。帖子的标题是:“我的信用分数是780分,但我的生活已经归零。”
帖子很长,详细描述了他这五年的经历。他说他一直相信这个系统会给他一个公道。他说他按时还款、遵纪守法、积极参加社区活动,努力提升自己的信用分数。他说他以为只要分数够高,就能证明自己是一个值得被信任的人。
但分数没有救他。
帖子发出去之后,引发了大量的转发和评论。有人说他是受害者,有人说他是贪婪的投资者,也有人说这一切都是系统的错。
官方媒体很快发了通稿,说是”个别投资者的非理性行为”,与城市信用系统无关。但网上的讨论并没有因此平息,反而越来越激烈。
陈望海是在那天晚上看到这个消息的。
他看到那个标题的时候,心里咯噔了一下。“我的信用分数是780分”—780分,比他高了将近一百分。
他打开了那个帖子。帖子已经被删了,但他找到了一个截图。
他看着那个截图,看了很久。
780分。这个分数意味着什么?意味着那个人在系统眼里,是一个”信用优良”的市民。他按时还款,不违法乱纪,积极参与社会活动。但系统没有看到的是:他的生活已经被摧毁了。他失去了所有的积蓄,失去了家庭,失去了活下去的意义。
系统给了他一个高分,但系统没有给他任何帮助。
陈望海放下手机,走到阳台上。
夜空中有几颗星星,但大部分被城市的灯光遮住了。他看着那些若隐若现的星光,突然想起了赵海涛。
他拿出手机,拨通了赵海涛的电话。
电话响了很久才接通。
“海涛,你还好吗?”
“还好,“赵海涛的声音听起来很疲惫,“怎么了?”
“没什么,就是想问问你的情况。”
电话那头沉默了一会儿。然后赵海涛说:“老陈,我看到新闻了。那个跳楼的人,我认识。”
陈望海愣住了。
“他也投资了我的平台,“赵海涛说,“二十万,一分钱都没拿回来。这五年他找过我很多次,让我还钱。我说我会还,但需要时间。他每次都说没关系,让我慢慢来,他相信我。”
“但他自己…”赵海涛的声音开始发抖,“他从来没有告诉过我,他过得这么难。我以为他只是普通投资者,我以为他能撑下去…”
陈望海不知道该说什么。他只能静静地听着电话那头的呼吸声。
“老陈,“赵海涛说,“我不想再说什么了。我只想问你一件事。”
“什么事?”
“你相信我吗?”
陈望海沉默了很久。然后他说:“我信。“
九、破局
五月初,陈望海做了一个决定。
他把自己三年来所有的工作成果整理成了一份文档。文档的内容包括:城市信用评分系统的算法逻辑、数据采集的覆盖范围、信用评分与社会行为的实际相关性,以及他发现的各种问题。
这份文档的标题是:“关于城市信用评分系统运行情况的调研报告”。
他没有把这份报告发给周海文。他知道,发给周海文不会有任何结果。
他发给了另外一个人。
那个人叫张晓薇,是他在北京读研究生时的师姐。她现在在一个叫”公共利益研究院”的机构工作,专门做政策研究和公共倡导。他们已经很多年没联系了,但他还记得她当年说过的一句话:“我们学数据的,最重要的不是学会分析数据,而是学会质疑数据。”
他把文档发给了张晓薇,同时附了一封信。信的内容很简短:
“师姐,我这里有一些东西,可能你会感兴趣。如果你决定公开,请确保我的身份不要被暴露。我还有家人要养。”
三天后,张晓薇回复了他。
“望海,我看完你的文档了。你做得对。这些信息应该被公开。但我也理解你的顾虑。我向你保证,在任何公开场合,你的身份都不会被透露。我们会做技术处理,让溯源变得不可能。”
“另外,我想问你一件事。”
“什么事?”
“我注意到你的文档里有一个数字—相关性系数0.23。这个数字你是怎么得出的?”
陈望海把分析过程简单描述了一下。
张晓薇沉默了很久。然后她说:“望海,你知道吗,这个数字可能会改变一些事情。”
“可能吧。但我不知道会改变什么。”
“至少是一个开始,“张晓薇说,“很多事情,都是从一个数字开始的。”
两周后,公共利益研究院发布了一份报告。报告的标题是:“城市信用评分系统运行现状评估—基于数据的实证分析”。
报告的核心结论是:城市信用评分与社会行为的实际表现之间,存在显著的系统性偏差。信用评分的激励机制存在缺陷,可能导致”逆向选择”和”道德风险”。
报告发布的那天,陈望海正在工位上写代码。他的手机突然震动个不停。他打开手机,发现是城市信用的App推送了一条消息:
“您的信用评分已更新。当前分数:712分(较昨日提升25分)。评分提升原因:积极履行公民职责,主动参与公共事务。”
他看着这条消息,突然觉得很讽刺。
他的分数上升了。是因为他”积极履行公民职责”吗?是因为他”主动参与公共事务”吗?还是因为别的原因?
他不知道。但他有一种预感—这个分数的变化,和那份报告的发布有关。
十、归途
六月中旬,陈望海辞了职。
辞职的过程比他想象的简单。周海文看着他递上来的辞呈,沉默了很久,然后说:“你想清楚了?”
“想清楚了。”
“离开这里,你打算去哪?”
“还没想好,“陈望海说,“但我知道,我不能再做现在这件事了。”
周海文点点头。他没有挽留,只是在辞呈上签了字。
“望海,“陈望海走到门口的时候,周海文突然叫住了他,“我有一句话想跟你说。”
“说。”
“你在这里三年,做了很多工作。有些工作…我知道你心里有抵触。但我想让你知道,不只是你有抵触。”
陈望海回过头,看着周海文。
周海文的脸上是一种他从未见过的表情—不是愤怒,也不是遗憾,而是一种很深的疲惫。
“我也有抵触。但我没有你勇敢。”
陈望海没有说话。他点了点头,然后走出了办公室。
辞职后的第一个月,陈望海带着家人去了一趟云南。
他们去了大理,去了丽江,去了香格里拉。他们住在一家藏族人的客栈里,客栈的老板是一个五十多岁的大叔,脸上布满了高原特有的红晕。
有一天晚上,陈望海和客栈老板坐在院子里聊天。老板问他:“你们是从城里来的吧?”
“是,从北京。”
“北京,好地方。“老板给他倒了一杯酥油茶,“大城市我年轻的时候去过一次,太大了,走在街上都不知道该往哪儿走。”
陈望海笑了笑:“现在还是那样。”
老板看着他,似乎在打量他:“我看你有心事。”
“为什么这么说?”
“你的眼睛。“老板指了指自己的眼睛,“你的眼睛里有一种东西,像是被什么东西压着。在草原上,我们管这种东西叫’伏藏’——就是心里藏了太多东西,背不动了,但又放不下来。”
陈望海沉默了很久。他不知道该怎么回答。
“我不知道你在做什么工作,“老板继续说,“但我看得出来,你是一个认真的人。在草原上,我们尊敬认真的人。但我也想告诉你一件事。”
“什么事?”
“草原上的风,有时候会很大。大风来的时候,帐篷会被吹走,牛羊会走散。但草原上的风,从来不会一直吹下去。再大的风,也有停的时候。”
陈望海看着头顶的星空。那些星星比在城市里看到的亮得多,密密麻麻地铺满了整个天幕。
“谢谢您。“他说。
“不用谢。“老板站起来,拍了拍身上的灰,“好好休息。明天我带你们去看日出。”
客栈老板说的日出,陈望海后来真的去看了。
那是凌晨四点,他们坐上老板的吉普车,在黑暗中行驶了将近一个小时,到达了一个山顶。山顶上已经有十几个人在等待了,都是客栈里的客人。大家裹着毛毯,在寒风中瑟瑟发抖,但眼睛都望着同一个方向——东方的地平线。
天边慢慢变亮,从深蓝变成浅蓝,再变成橙色,再变成金色。太阳从山脊后面升起的那一刻,所有人都发出了惊叹声。
陈望海站在人群中,看着那轮红日。他的眼眶突然湿润了。
他想起了很多事。想起了三年前的自己,坐在北京的出租屋里,对着电脑屏幕写代码。想起了赵海涛,那个在城中村握手楼里接他电话的人。想起了新闻里那个跳楼的中年人,那个分数780分却失去了一切的人。想起了自己写的那份报告,那个0.23的相关性系数。
他想起了很多很多。
然后他想起了客栈老板的话:再大的风,也有停的时候。
辞职后的第三个月,陈望海收到了一封邮件。
邮件是张晓薇发来的。
“望海,不知道你最近怎么样。有一件事想告诉你——研究院正在筹备一个新的项目,关于数字时代的公民权利研究。我们需要一个懂数据、懂技术、也愿意反思技术的人来参与。你有兴趣吗?”
“这个项目不是要反对技术,“张晓薇在邮件里写道,“而是要让技术变得更好。我们相信,技术的未来不是由算法决定的,而是由使用算法的人决定的。而那些使用算法的人,需要有人告诉他们:你们的选择是有后果的。”
陈望海看着这封邮件,想了很久。
他打开回复框,开始打字。
“师姐,我有兴趣。但我想先问你一个问题。”
“什么问题?”
“如果我们做这个项目,最后发现我们的声音没有用呢?如果我们发出去了,但没有人听呢?”
张晓薇的回复来得很快。
“望海,我给你讲一个故事吧。有一年,我在藏区徒步,迷了路。我走了很久很久,一直走到天黑,也没有找到路。那时候我很绝望,我觉得我可能会死在那里。”
“但后来呢?“陈望海问。
“后来我看到了一盏灯。很远,很微弱,但确实是灯。我朝着那个方向走,最后走到了一个牧民的家。他们给我吃了糌粑,让我睡在他们的帐篷里。第二天一早,他们把我带回了公路。”
“望海,我们的声音可能很微弱,就像黑暗中的一点光。但只要你发出去了,就一定有人能看到。只要有人能看到,就一定有希望。”
陈望海看着屏幕,嘴角露出了一个微笑。
他想,这大概就是他想要的意义吧。不是成为一个英雄,不是成为一个揭露真相的勇士。只是在黑暗中,发出一点微弱的光。让那些迷路的人,知道自己不是孤独的。
他回复道:“师姐,我来。“
尾声
一年后。
陈望海坐在研究院的办公室里,阳光从窗户照进来,落在他的桌上。桌上放着一杯咖啡,咖啡旁边是一沓打印出来的文件。
那是他参与撰写的一份研究报告,主题是”算法治理与公民权利:数据伦理的本土化探索”。
报告还没有正式发布。但他知道,它一定会引起争议。有人会支持,有人会反对。有人会说他是在推动社会进步,也有人会说他是在多管闲事。
但他不在乎了。
他的手机放在桌上,屏幕朝下。城市信用的App他已经卸载了——不是因为他不在乎自己的分数,而是因为他想明白了一件事:分数不应该是一个人的全部。分数只是分数,它不能定义一个人的人生。
他的妻子林小婉上周找到了一份新工作,在一家公益机构做项目主管。她的分数也经历了波动,但她已经不再每天盯着那个数字看了。
“你最近在看什么?“有一次林小婉问他。
“在看一些旧的东西,“他说,“以前写的一些代码什么的。”
“看那些干嘛?”
“就是……突然想看看。”
他想起自己三年前写的那些代码。那些代码现在还在运行着,被无数人使用着。它们像数字时代的血管,渗透进这个城市的每一个角落。他写的那些算法,现在还在决定着一些人的分数,一些人的命运。
他应该感到愧疚吗?他不知道。他只知道,过去的事情已经无法改变了。他能做的,只有在未来的路上,做一些不一样的事情。
他的电脑屏幕上,有一行他刚刚写下的注释:
”// 记住:数据是人,数据背后是人心。”
他看着这行字,想起了很久以前,在北京的出租屋里,他对着电脑屏幕敲下第一行代码的情景。那时候他相信技术可以改变世界。现在他依然相信,只是他理解的方式不一样了。
技术可以改变世界——但前提是,技术背后的人,必须是一个有良心的人。
他保存了文件,站起身来,走到窗前。
窗外是城市的天际线,高楼大厦鳞次栉比,像一片钢铁的森林。阳光照在那些玻璃幕墙上,反射出耀眼的光芒。
他想,在这座城市的某个地方,也许有一个年轻人,和三年前的他一样,坐在某间办公室里,写着某段代码。他不知道那个年轻人有没有意识到,自己写下的每一行代码,都可能影响无数人的人生。
但如果有一天,那个年轻人也开始思考这个问题,开始质疑自己正在做的事情——那么,一切就不算太晚。
他转身,回到办公桌前,继续工作。
窗外,阳光正好。
【全文完】
字数统计:约18000字