白宫大量清除气候﹑传染病及性别数据,民间能否自救?

每天都有新的内容消失、链接失效,或是被重新上传,人们无法明确知道究竟多少信息遭到抹除或是删改。
2025年5月30日,美国佛罗里达州迈阿密,特朗普政府解雇了国家海洋和大气管理局(NOAA)的数百名员工,并删除了包含天气和气候数据的政府网站。图为热带气象分析员艾登(Aidan Mahoney)在NOAA的工作站上工作。摄:Chandan Khanna/AFP via Getty Images

真人秀或纪录片中常会出现囤积狂群体。他们难以自制地储存与收集,用纸箱、碎布、过期的食品将房间的每个缝隙填满,带来极具视觉冲击的成果。在数字时代,这种行为也延伸到数据上。这时,难以割舍的对象成了 10 万张照片、家人数十年的直播视频、跨度长达 50 年的航拍胶片,或是任何一个能搜罗到的播客节目。

Reddit 论坛上,r/DataHoarder 的社区拥有超 85 万名成员,是一个十分活跃的社区。就像随处可见的极客圈子,人们分享技术经验,交流设备的利弊、如何提升效率;偶尔,这里也会化身赛博忏悔室,容人们为近乎强迫的数据囤积行为告解。

“囤积病友”们共享着一个普遍的信念,即对第三方平台的不信任。就像把现金从银行中取出塞到床板里的人,为摆脱云存储等服务的不确定性,他们在家中堆栈出数据的山洞。对关键数据遵循 3-2-1 的备份铁律── 3 个副本,2 种存储媒介,1 份异地保存──以保证即便房子被大火烧毁,它们也不会丢失。

但特朗普的就职带来了比屋顶着火更混乱的危机:数据被直接清除了。

随着 1 月 20 日,特朗普入主白宫,数条有关性别认定、DEI(多元化、公平和包容)的总统行政令颁布,美国联邦政府各个部门陷入一场紧急的自我清查。甚至在某一时刻,NASA 的工作人员被告知,放下手中所有事宜,把信息删除作为当前的第一要务。

囤积狂的担忧不无道理。“互联网永远不会忘记”的语录,如今已经很难反映现实。2024 年的一项研究显示,互联网正在腐烂,十年间 66.5% 的网络链接失效,变成 404 的界面,或不再导向原本的内容。手忙脚乱的抢救之后,人们亟需更清晰的认识,数据公开为何重要,它们的消失对社会有怎样的影响?

2025年4月29日,美国华盛顿特区,特朗普政府以削减成本为由将约121,000名联邦工作人员解雇,被解雇的联邦雇员走进美国参议员卡西迪(Bill Cassidy)的办公室。摄:Kayla Bartkowski/Getty Images

哪些数据被删除了?

  • AtlasPlus,一个帮助用户分析 HIV、性病、结核病和病毒性肝炎数据的交互工具
  • 提供生殖保健和堕胎资源的网站 reproductiverights.gov
  • 美国空军首位女性战斗机飞行员莱维特(Jeannie Leavitt)的的传记、照片、视频
  • 农业部有关气候变化的数据集以及工具
  • 林务局介绍气候危机如何导致野火强度和频率增加的页面

这只是特朗普就任以来消失数据的冰山一角。它们代表了这些数据所影响的一些重点领域。比如医学,尤其是与艾滋病以及疫苗研究相关的信息,在本轮的清查中遭到大量删除。医学媒体 KFF 报道,国立卫生研究院(NIH)官员敦促科学家,从拨款申请中删除对 mRNA 疫苗技术的提及。尽管该技术在新冠疫情中拯救了数百万人的生命,特朗普支持者中强势的疫苗怀疑论力量让这届政府调转方向,对其发起攻击。

如今,打开美国疾病控制与预防中心(CDC)的网页,能看到许多页面仍标注着,“CDC 网站正在进行修改,以遵守特朗普总统的行政命令。”这主要指向两条行政令:一条名为“保护妇女免受性别意识形态极端主义的侵害”,其中提出,美国政府将只承认两种性别,男性和女性,且不可改变;另一有关 DEI 的行政令则要求,终止所有 DEI 相关职位、倡议、项目和支出。

这些要求导致大量健康数据集和指南被紧急下线。新规下,性别指代统一为“sex”。医学媒体 STAT 指出,历来许多数据集使用的是“gender”一词来进行性别分类。这些数据集因此被整体下线,替换词汇后才部分重新上线。

调查青少年饮酒、吸毒和危险性行为等活动的青少年风险行为监测系统 (YRBSS)、行为风险因素监测系统 (BRFSS)两个数据集,也因收集了性别认同和性取向等要素,遭到删除。而后不久,在一名联邦法官的要求下,这些页面得到恢复。但多了一条标注,称:“本页面上任何宣扬性别意识形态的信息都是极其不准确的,与存在男性和女性这一永恒不变的生物现实脱节。特朗普政府拒绝性别意识形态,并谴责其所造成的伤害——包括对儿童的‘化学与外科变性手术’,以及对女性尊严、安全、福祉与机会的剥夺。此页面并不反映生物现实,因此本政府及本部门拒绝接受其内容。”。

美国疾病控制与预防中心(CDC)有关LGBTQ青年网页的标注信息。

艾滋病相关的信息尤其受影响,许多一度遭到无差别删除。“因为艾滋病毒中涉及的性别内容太多了,我们必须删除所有内容,才能赶上最后期限。”一名政府机构员工对 NBC News 表示。诸多包含 LGBT 群体的页面,比如“LGBT 青少年群体自杀”、“如何为 LGBT 青少年创造安全校园”等信息,至今也没有得到恢复。

尽管打击 LGBT 群体时,特朗普团队打着“保护女性”的旗号,但关于女性的信息也也逃不过大规模抹除是。阿灵顿国家公墓(美国最著名的军事公墓)、军队、五角大楼和 NASA 官网均对有关女性的文章页面进行了删除,一些有关女性军人、历史人物事迹的照片与介绍消失不见。“本届政府在军队外面挂了一块牌子,上面写着:如果你不是白人男性,你就不再受欢迎,”前退伍军人事务部助理部长 Sue Fulton 对 NPR 表示。

女性健康也在此行动下受到威胁。CDC 的避孕指南一度遭到删除。如今,在其官网搜索“堕胎”,系统还会自动建议用户,“也尝试一下:收养”。CDC 负责妊娠风险评估监测系统(PRAMS)的团队被集体行政休假。在此之前,该团队的工作为维护美国孕产妇健康提供着重要的研究依据,通过长期和广泛的调研,分析二手烟、虐待、保险等因素的影响。

此外,特朗普一如既往的气候否认(climate denial)也反映在数据删除中。曾经的环境质量委员会(CEQ)、科学技术政策办公室(OSTP)变成空壳网站;环境保护局(EPA)网站上,气候变化相关引用和链接内容被清除,可供人们查看所在社区工业污染程度的工具遭到下架,每年 4 月中旬强制发布的温室气体报告近 30 年来首次开天窗;国土安全部(DHS)的网站删除了几个“重点”主题,“解决气候危机”就是其中之一。

仿若野火过境,公共部门与研究人员经年累积搭建的关键数据集与信息工具,在几周的时间内支离破碎。每天都有新的内容消失、链接失效,或是被重新上传,人们无法明确知道究竟多少信息遭到抹除或是删改。但观察者发现,负责政府信息公开的重要网站 Data.gov 一度有 2000 多个数据集消失;包括USAID.gov、NeglectedDiseases.gov 在内的数千个政府网页关闭,点进去只剩下关停的公告;根据医学媒体 STAT 的实时数据,疾控中心 CDC 网站原本 1488 个可供下载的数据集已经有至少 143 个遭到删除。

敏感词的清单越来越长。媒体从政府内部获知的敏感词,包括但不仅限于:trans(跨性别)、nonbinary(非二元)、diversity(多样性)、women(女性)、Covid、Gay/ Gender(同性/性别)、bias(偏见)、privilege(特权)、minority(少数族裔)、underrepresented(未被代表的)、DEIA(多样性、公平、包容和无障碍)、inclusion(包容)、Indigenous People(原住民)、Environmental Justice(环境正义)……这种筛查方式有明显的漏洞──在二战中向广岛投掷了原子弹的轰炸机 Enola Gay 号的照片被国防部删除,只因其名称中有 Gay;一名姓氏为盖伊的工程师也遭到牵连。

2025年4月30日,美国纽约市曼哈顿,人们走过世界贸易中心交通枢纽。摄:Spencer Platt/Getty Images

数据被删除了,世界会变成怎样?

美国青少年中,有 30% 的女性考虑过自杀,比例比男性高出 16%;LGBTQ+ 青少年中考虑过自杀比例为 45%,比认定为异性恋的青少年高 30%;美国婴儿死亡率是发达国家中最高的之一,2022 年千名活产婴儿中有 5.6 人死亡;美国人口一生中患癌风险为百万分之十,而距离排放源更近的城市地区人口,该风险则超百万分之一百。

数据,构成了人们理解世界的基础;它们的存在得益于政府级别机构数十年的持续收集,大量人力物力投入,才构成在规模和时间跨度上都具备意义的数字。数据也提供了监督的依据。据报告,在美国环保署(EPA)要求化工厂披露污染物监测数据以来,苯超标的炼油厂数量下降了一半。

而相应的,当数据消失,或是背后的投入中断,人们对于世界的感知就会陷入一片无从追踪的迷雾中。

公共卫生数据缺失,会让传染病源头和传播路径难以追溯。对于美国,近期出现的麻疹疫情,以及近年来结核病发病率的持续上升,都是需要十分警惕的趋势。公共卫生学者 Lyndon Haviland 指出,美国退出世界卫生组织后,追踪和监测全球传染病传播会变得更加困难,“我们应该投资于积极的监测、研究和服务,而不是减少或取消。如果结核病在世界范围内的蔓延,也会增加美国感染的风险。”

AtlasPlus 是一个拥有近 20 年的艾滋病毒、病毒性肝炎、性传播感染和结核病监测数据的交互工具。用户可以用它制作图表,了解社会因素与疾病之间的关联。Huffpost 报道指出,此前,AtlasPlus 帮助官员将联邦资源引导到丙肝感染率高的美国农村县──其与大范围的共和党选区重叠,为应对阿片危机做出贡献。因此,该工具在这一波删除中的临时下线引发了公卫人员的广泛担忧。

2025年5月24日,美国新墨西哥州霍布斯一架杂货店的停车场,Renee Barbian为她免疫功能低下的儿子注射胰岛素。摄:Julio Cortez/AP/达志影像

“这些数据集不仅是统计数据,也是我们的早期预警系统,是社区福祉的地图。”斯坦福大学人口健康兼职教授 Nirav Shah 告诉 Huffpost,“通过消除这些资源,我们不只是隐藏了数字,还削弱了自己保护和维护全体美国人健康的能力。”

对具体人群抗感染能力信息的获取不足,会让部分群体成为盲区。2022 年,黑人和拉丁裔分别占美国新增艾滋病毒病例的 37% 和 33%,尽管他们只占据总人口的 12% 和 18%。感染人群的比例失调,意味着救助与预防资源的分配也应当有所偏倚,以带来最有效的结果。“如果我们不能谈论艾滋病,我们如何才能在最容易感染艾滋病的人群中预防艾滋病毒呢?”一名 CDC 的工作人员告诉 nbcnews。

将 gender 替换为 sex,看似只是咬文嚼字,实际上也会抹除具体人群的存在。根据韦氏词典,sex 是一个生物学术语;而在行为、文化或心理特征的语境下, 对性别指代的首选则通常是 gender。2001 年,美国医学研究所(IOM)的一个研讨会上指出,无论男女,他们的健康状况都不仅仅是生物学的产物,还受到社会文化和心理体验的影响。因此,sex 和 gender 的区分在当时被定义出来,为了“更精准地用语言来传递知识”。

在接下来的 20 多年中,这种划分给了研究者精度更高的视角,他们发现了不同人群抵御疾病、应对气候灾害能力的差异,公共政策实施效果的不同,对于 LGBTQ+ 群体的霸凌与自杀研究有了更扎实的依据。而此时此刻,重新将人群简单粗暴以男女划分,会将很多潜在的造成群体差异的因素也排除在了研究者的视野外。

同时,数据缺失会给推进公共政策制定带来极大难度。阿拉斯加地区的社工 Laura Norton-Cruz 通过 CDC 的妊娠风险评估监测系统(PRAMS)识别地区内低母乳喂养率的情况,了解如何预防家庭暴力、性暴力,并干预儿童的创伤经历。因此,她对媒体表示,这个关键团队的无限期休假让她尤其感到担忧。“妈妈们需要安全的住房和家庭暴力救助资源,需要医疗保健和母乳喂养支持,但如果我们不能证明这一点,那么政府就有理由不提供。”

2024年10月11日,美国佛罗里达州新里奇港,3级台风米尔顿(Hurricane Milton)掠过后,一名行人穿过因安克洛特河(Anclote River)水位上升而被淹没的街道。摄:Spencer Platt/Getty Images

气候变化相关的政策也是如此。失去数据的支持,对于气候变化的追踪和影响的评估难以具象化,会给本身并无依据的怀疑论更多的可解释空间。比如,当下的气候究竟是让人受益还是遭害?特朗普曾发表过这样的言论,“海平面上升是好事,这样我们就有更多海景房了。”类似的说辞让人们对气候环境改变影响的情绪感受变得暧昧不清。

而事实是怎样呢?根据 NOAA 自 1980 年起的持续追踪,在 2010 年代,自然灾害对美国造成的经济损失远高于以往年代。这 44 年中,损失最大的五个单年尤其集中于近期,从高到底分别为 2017 年、2005 年、2022 年、2024 年以及 2021 年。数据集强调不对结果进行归因,但气象灾害、极端天气的加剧,人群的脆弱性增加都是切实存在的,亟需社区加强适应性建设,以应对更为频繁的危机。

但未来的人们不再有参考的标尺。5 月 8 日,NOAA 宣布,“因优先级、法定要求和人员配置的不断变化”,这个已经运行了近半个世纪的“十亿美元天气和气候灾害”数据库退役,不再更新。它就像一个在轰炸中被毁坏的时钟,停留在了这个数字上:1980 年至 2024 年,美国共发生 403 起总损失不低于 10 亿美元的重大气象灾害,这 403 起事件的总成本超过 2.915 万亿美元。

接上光纤电缆的伺服器机房。摄:Daniel Reinhardt/picture-alliance/dpa/AP/达志影像

民间数据搜救

特朗普第一任期内就曾采取过数据删除的行动。当时主要针对的是与气候变化和清洁能源有关的信息。因此,在他再次获选后,一些民间组织、研究机构很快组织起来,采取行动。

看似与世无争的数据囤积者们正是其中的重要一员。在r/DataHoarder 板块,置顶的帖子变成了围绕政府数据存档的方法介绍与进度追踪。根据介绍,他们在 Internet Archive 主管 Jason Scott 的主持下,通过一众志愿者的集体力量,对联邦政府网页进行备份,上传到安全的公共存储库。参与者们大多只是普通的 IT 工作者,出于一些朴素的愿望贡献出自己的时间与带宽。

这样的自发力量在短时间内上传了海量的信息。基于这些信息,3 月,他们得以创建出一个仿真的 CDC 网站 restoredCDC.org。他们依靠已备份的内容,一比一复制了 1 月 20 日前的 CDC 网站,还重建了网页交互,让用户能像穿梭回到原始网站中一样,自由地进行信息搜索。

此外,自 2008 年以来,“任期末网络档案馆”(EOT)就开始有计划地在每任美国政府换届的时间点对政府网站进行存档。这个无党派行动由包括 Internet Archive、通用爬虫基金会(CCF)、环境数据与治理倡议(EDGI)、哈佛法学院图书馆、斯坦福大学图书馆等机构共同协作展开,迄今已经是第五届。针对本次换届,EOT 存档了超过 1 亿个网页,数据总量超 500 TB,是上一次换届的两倍多。

各大高校也组织数据黑客马拉松,参与到这场抢救中。多伦多大学的研究人员组织了对气候数据的抓取活动;哈佛大学的师生聚集在一起,自我培训如何从政府网站保存公共卫生数据。2 月创建的“数据拯救项目”(Data Rescue Project)负责协调一系列团体的备份行动,以追踪进度,避免重复备份。根据该组织的记录,目前已经有超 1030 个被删除或受威胁的数据集备份完毕,范围覆盖疾控、住房、能源、教育、劳工等等。

但人们难以放松紧绷的神经。让人忧心的是,即便过往的数据得以幸存,如果新的数据不再产生,那么也难有现实意义。而数据收集是很难通过民间力量填补的。以 NOAA 的“十亿美元天气和气候灾害”数据库为例,它的独特之处不仅在于长时间的收集,更在于它提取了大多数科研机构和私立组织都无法访问的非公开数据源,几乎不可能被取代或复制。

2025年3月31日,美国华盛顿特区国家广场,示威者正在参加“让跨性别被看见”(Transgender Day of Visibility)集会。摄:Evelyn Hockstein/Reuters/达志影像

删除过去的数据就如同擦除人们的记忆。纽芬兰纪念大学客座教授、 LGBTQ 历史和女性研究学者 Alessio Ponzio 对 NPR 表示,“这是一种非常微妙的暴力行为,但真的能摧毁人们的心理。基本上就是在说,‘我告诉你,我不认识你了’。”

而停止新数据的收集则会模糊人们对当下状况的判断。ProPublica 特别指出,即便是描绘了共和党执政蓝图的“2025 计划”,也并未建议政府撤销数据收集。反而,在移民执法等领域,它还敦促政府在数据获取上加大力度。这不得不让人思考,如此大规模的数据删除究竟是有何用意。ProPublica 认为,“当一个政府如此齐心协力地压制对政府乃至整个社会的评估时,很难不得出这样的结论:它对当前国家改革的有效性缺乏信心。”

评论区 2

评论为会员专属功能。立即登入加入会员享受更多福利。
  1. 有关于简中的数据删除和数据搜救相关信息吗

  2. 一条狗的生活意见_我代为打字说道:

    trump is a shitty shit
    为志愿者们感到骄傲❤️!