真人秀或紀錄片中常會出現囤積狂群體。他們難以自制地儲存與收集,用紙箱、碎布、過期的食品將房間的每個縫隙填滿,帶來極具視覺衝擊的成果。在數字時代,這種行為也延伸到數據上。這時,難以割捨的對象成了 10 萬張照片、家人數十年的直播視頻、跨度長達 50 年的航拍膠片,或是任何一個能蒐羅到的播客節目。
Reddit 論壇上,r/DataHoarder 的社區擁有超 85 萬名成員,是一個十分活躍的社區。就像隨處可見的極客圈子,人們分享技術經驗,交流設備的利弊、如何提升效率;偶爾,這裏也會化身賽博懺悔室,容人們為近乎強迫的數據囤積行為告解。
「囤積病友」們共享着一個普遍的信念,即對第三方平台的不信任。就像把現金從銀行中取出塞到床板裏的人,為擺脫雲存儲等服務的不確定性,他們在家中堆棧出數據的山洞。對關鍵數據遵循 3-2-1 的備份鐵律── 3 個副本,2 種存儲媒介,1 份異地保存──以保證即便房子被大火燒燬,它們也不會丟失。
但特朗普的就職帶來了比屋頂着火更混亂的危機:數據被直接清除了。
隨着 1 月 20 日,特朗普入主白宮,數條有關性別認定、DEI(多元化、公平和包容)的總統行政令頒布,美國聯邦政府各個部門陷入一場緊急的自我清查。甚至在某一時刻,NASA 的工作人員被告知,放下手中所有事宜,把信息刪除作為當前的第一要務。
囤積狂的擔憂不無道理。「互聯網永遠不會忘記」的語錄,如今已經很難反映現實。2024 年的一項研究顯示,互聯網正在腐爛,十年間 66.5% 的網絡鏈接失效,變成 404 的界面,或不再導向原本的內容。手忙腳亂的搶救之後,人們亟需更清晰的認識,數據公開為何重要,它們的消失對社會有怎樣的影響?

哪些數據被刪除了?
- AtlasPlus,一個幫助用戶分析 HIV、性病、結核病和病毒性肝炎數據的交互工具
- 提供生殖保健和墮胎資源的網站 reproductiverights.gov
- 美國空軍首位女性戰鬥機飛行員萊維特(Jeannie Leavitt)的的傳記、照片、視頻
- 農業部有關氣候變化的數據集以及工具
- 林務局介紹氣候危機如何導致野火強度和頻率增加的頁面
這只是特朗普就任以來消失數據的冰山一角。它們代表了這些數據所影響的一些重點領域。比如醫學,尤其是與艾滋病以及疫苗研究相關的信息,在本輪的清查中遭到大量刪除。醫學媒體 KFF 報道,國立衛生研究院(NIH)官員敦促科學家,從撥款申請中刪除對 mRNA 疫苗技術的提及。儘管該技術在新冠疫情中拯救了數百萬人的生命,特朗普支持者中強勢的疫苗懷疑論力量讓這屆政府調轉方向,對其發起攻擊。
如今,打開美國疾病控制與預防中心(CDC)的網頁,能看到許多頁面仍標註着,「CDC 網站正在進行修改,以遵守特朗普總統的行政命令。」這主要指向兩條行政令:一條名為「保護婦女免受性別意識形態極端主義的侵害」,其中提出,美國政府將只承認兩種性別,男性和女性,且不可改變;另一有關 DEI 的行政令則要求,終止所有 DEI 相關職位、倡議、項目和支出。
這些要求導致大量健康數據集和指南被緊急下線。新規下,性別指代統一為「sex」。醫學媒體 STAT 指出,歷來許多數據集使用的是「gender」一詞來進行性別分類。這些數據集因此被整體下線,替換詞彙後才部分重新上線。
調查青少年飲酒、吸毒和危險性行為等活動的青少年風險行為監測系統 (YRBSS)、行為風險因素監測系統 (BRFSS)兩個數據集,也因收集了性別認同和性取向等要素,遭到刪除。而後不久,在一名聯邦法官的要求下,這些頁面得到恢復。但多了一條標註,稱:「本頁面上任何宣揚性別意識形態的信息都是極其不準確的,與存在男性和女性這一永恆不變的生物現實脫節。特朗普政府拒絕性別意識形態,並譴責其所造成的傷害——包括對兒童的『化學與外科變性手術』,以及對女性尊嚴、安全、福祉與機會的剝奪。此頁面並不反映生物現實,因此本政府及本部門拒絕接受其內容。」。

艾滋病相關的信息尤其受影響,許多一度遭到無差別刪除。「因為艾滋病毒中涉及的性別內容太多了,我們必須刪除所有內容,才能趕上最後期限。」一名政府機構員工對 NBC News 表示。諸多包含 LGBT 群體的頁面,比如「LGBT 青少年群體自殺」、「如何為 LGBT 青少年創造安全校園」等信息,至今也沒有得到恢復。
儘管打擊 LGBT 群體時,特朗普團隊打着「保護女性」的旗號,但關於女性的信息也也逃不過大規模抹除是。阿靈頓國家公墓(美國最著名的軍事公墓)、軍隊、五角大樓和 NASA 官網均對有關女性的文章頁面進行了刪除,一些有關女性軍人、歷史人物事蹟的照片與介紹消失不見。「本屆政府在軍隊外面掛了一塊牌子,上面寫着:如果你不是白人男性,你就不再受歡迎,」前退伍軍人事務部助理部長 Sue Fulton 對 NPR 表示。
女性健康也在此行動下受到威脅。CDC 的避孕指南一度遭到刪除。如今,在其官網搜索「墮胎」,系統還會自動建議用戶,「也嘗試一下:收養」。CDC 負責妊娠風險評估監測系統(PRAMS)的團隊被集體行政休假。在此之前,該團隊的工作為維護美國孕產婦健康提供着重要的研究依據,通過長期和廣泛的調研,分析二手菸、虐待、保險等因素的影響。
此外,特朗普一如既往的氣候否認(climate denial)也反映在數據刪除中。曾經的環境質量委員會(CEQ)、科學技術政策辦公室(OSTP)變成空殼網站;環境保護局(EPA)網站上,氣候變化相關引用和鏈接內容被清除,可供人們查看所在社區工業污染程度的工具遭到下架,每年 4 月中旬強制發布的溫室氣體報告近 30 年來首次開天窗;國土安全部(DHS)的網站刪除了幾個「重點」主題,「解決氣候危機」就是其中之一。
仿若野火過境,公共部門與研究人員經年累積搭建的關鍵數據集與信息工具,在幾周的時間內支離破碎。每天都有新的內容消失、鏈接失效,或是被重新上傳,人們無法明確知道究竟多少信息遭到抹除或是刪改。但觀察者發現,負責政府信息公開的重要網站 Data.gov 一度有 2000 多個數據集消失;包括USAID.gov、NeglectedDiseases.gov 在內的數千個政府網頁關閉,點進去只剩下關停的公告;根據醫學媒體 STAT 的實時數據,疾控中心 CDC 網站原本 1488 個可供下載的數據集已經有至少 143 個遭到刪除。
敏感詞的清單越來越長。媒體從政府內部獲知的敏感詞,包括但不僅限於:trans(跨性別)、nonbinary(非二元)、diversity(多樣性)、women(女性)、Covid、Gay/ Gender(同性/性別)、bias(偏見)、privilege(特權)、minority(少數族裔)、underrepresented(未被代表的)、DEIA(多樣性、公平、包容和無障礙)、inclusion(包容)、Indigenous People(原住民)、Environmental Justice(環境正義)……這種篩查方式有明顯的漏洞──在二戰中向廣島投擲了原子彈的轟炸機 Enola Gay 號的照片被國防部刪除,只因其名稱中有 Gay;一名姓氏為蓋伊的工程師也遭到牽連。

數據被刪除了,世界會變成怎樣?
美國青少年中,有 30% 的女性考慮過自殺,比例比男性高出 16%;LGBTQ+ 青少年中考慮過自殺比例為 45%,比認定為異性戀的青少年高 30%;美國嬰兒死亡率是發達國家中最高的之一,2022 年千名活產嬰兒中有 5.6 人死亡;美國人口一生中患癌風險為百萬分之十,而距離排放源更近的城市地區人口,該風險則超百萬分之一百。
數據,構成了人們理解世界的基礎;它們的存在得益於政府級別機構數十年的持續收集,大量人力物力投入,才構成在規模和時間跨度上都具備意義的數字。數據也提供了監督的依據。據報告,在美國環保署(EPA)要求化工廠披露污染物監測數據以來,苯超標的煉油廠數量下降了一半。
而相應的,當數據消失,或是背後的投入中斷,人們對於世界的感知就會陷入一片無從追蹤的迷霧中。
公共衛生數據缺失,會讓傳染病源頭和傳播路徑難以追溯。對於美國,近期出現的麻疹疫情,以及近年來結核病發病率的持續上升,都是需要十分警惕的趨勢。公共衛生學者 Lyndon Haviland 指出,美國退出世界衛生組織後,追蹤和監測全球傳染病傳播會變得更加困難,「我們應該投資於積極的監測、研究和服務,而不是減少或取消。如果結核病在世界範圍內的蔓延,也會增加美國感染的風險。」
AtlasPlus 是一個擁有近 20 年的艾滋病毒、病毒性肝炎、性傳播感染和結核病監測數據的交互工具。用戶可以用它製作圖表,了解社會因素與疾病之間的關聯。Huffpost 報道指出,此前,AtlasPlus 幫助官員將聯邦資源引導到丙肝感染率高的美國農村縣──其與大範圍的共和黨選區重疊,為應對阿片危機做出貢獻。因此,該工具在這一波刪除中的臨時下線引發了公衛人員的廣泛擔憂。

「這些數據集不僅是統計數據,也是我們的早期預警系統,是社區福祉的地圖。」斯坦福大學人口健康兼職教授 Nirav Shah 告訴 Huffpost,「通過消除這些資源,我們不只是隱藏了數字,還削弱了自己保護和維護全體美國人健康的能力。」
對具體人群抗感染能力信息的獲取不足,會讓部分群體成為盲區。2022 年,黑人和拉丁裔分別佔美國新增艾滋病毒病例的 37% 和 33%,儘管他們只佔據總人口的 12% 和 18%。感染人群的比例失調,意味着救助與預防資源的分配也應當有所偏倚,以帶來最有效的結果。「如果我們不能談論艾滋病,我們如何才能在最容易感染艾滋病的人群中預防艾滋病毒呢?」一名 CDC 的工作人員告訴 nbcnews。
將 gender 替換為 sex,看似只是咬文嚼字,實際上也會抹除具體人群的存在。根據韋氏詞典,sex 是一個生物學術語;而在行為、文化或心理特徵的語境下, 對性別指代的首選則通常是 gender。2001 年,美國醫學研究所(IOM)的一個研討會上指出,無論男女,他們的健康狀況都不僅僅是生物學的產物,還受到社會文化和心理體驗的影響。因此,sex 和 gender 的區分在當時被定義出來,為了「更精準地用語言來傳遞知識」。
在接下來的 20 多年中,這種劃分給了研究者精度更高的視角,他們發現了不同人群抵禦疾病、應對氣候災害能力的差異,公共政策實施效果的不同,對於 LGBTQ+ 群體的霸凌與自殺研究有了更紮實的依據。而此時此刻,重新將人群簡單粗暴以男女劃分,會將很多潛在的造成群體差異的因素也排除在了研究者的視野外。
同時,數據缺失會給推進公共政策制定帶來極大難度。阿拉斯加地區的社工 Laura Norton-Cruz 通過 CDC 的妊娠風險評估監測系統(PRAMS)識別地區內低母乳餵養率的情況,了解如何預防家庭暴力、性暴力,並干預兒童的創傷經歷。因此,她對媒體表示,這個關鍵團隊的無限期休假讓她尤其感到擔憂。「媽媽們需要安全的住房和家庭暴力救助資源,需要醫療保健和母乳餵養支持,但如果我們不能證明這一點,那麼政府就有理由不提供。」

氣候變化相關的政策也是如此。失去數據的支持,對於氣候變化的追蹤和影響的評估難以具象化,會給本身並無依據的懷疑論更多的可解釋空間。比如,當下的氣候究竟是讓人受益還是遭害?特朗普曾發表過這樣的言論,「海平面上升是好事,這樣我們就有更多海景房了。」類似的說辭讓人們對氣候環境改變影響的情緒感受變得曖昧不清。
而事實是怎樣呢?根據 NOAA 自 1980 年起的持續追蹤,在 2010 年代,自然災害對美國造成的經濟損失遠高於以往年代。這 44 年中,損失最大的五個單年尤其集中於近期,從高到底分別為 2017 年、2005 年、2022 年、2024 年以及 2021 年。數據集強調不對結果進行歸因,但氣象災害、極端天氣的加劇,人群的脆弱性增加都是切實存在的,亟需社區加強適應性建設,以應對更為頻繁的危機。
但未來的人們不再有參考的標尺。5 月 8 日,NOAA 宣布,「因優先級、法定要求和人員配置的不斷變化」,這個已經運行了近半個世紀的「十億美元天氣和氣候災害」數據庫退役,不再更新。它就像一個在轟炸中被毀壞的時鐘,停留在了這個數字上:1980 年至 2024 年,美國共發生 403 起總損失不低於 10 億美元的重大氣象災害,這 403 起事件的總成本超過 2.915 萬億美元。

民間數據搜救
特朗普第一任期內就曾採取過數據刪除的行動。當時主要針對的是與氣候變化和清潔能源有關的信息。因此,在他再次獲選後,一些民間組織、研究機構很快組織起來,採取行動。
看似與世無爭的數據囤積者們正是其中的重要一員。在r/DataHoarder 板塊,置頂的帖子變成了圍繞政府數據存檔的方法介紹與進度追蹤。根據介紹,他們在 Internet Archive 主管 Jason Scott 的主持下,通過一衆志願者的集體力量,對聯邦政府網頁進行備份,上傳到安全的公共存儲庫。參與者們大多隻是普通的 IT 工作者,出於一些樸素的願望貢獻出自己的時間與帶寬。
這樣的自發力量在短時間內上傳了海量的信息。基於這些信息,3 月,他們得以創建出一個仿真的 CDC 網站 restoredCDC.org。他們依靠已備份的內容,一比一複製了 1 月 20 日前的 CDC 網站,還重建了網頁交互,讓用戶能像穿梭回到原始網站中一樣,自由地進行信息搜索。
此外,自 2008 年以來,「任期末網絡檔案館」(EOT)就開始有計劃地在每任美國政府換屆的時間點對政府網站進行存檔。這個無黨派行動由包括 Internet Archive、通用爬蟲基金會(CCF)、環境數據與治理倡議(EDGI)、哈佛法學院圖書館、斯坦福大學圖書館等機構共同協作展開,迄今已經是第五屆。針對本次換屆,EOT 存檔了超過 1 億個網頁,數據總量超 500 TB,是上一次換屆的兩倍多。
各大高校也組織數據黑客馬拉松,參與到這場搶救中。多倫多大學的研究人員組織了對氣候數據的抓取活動;哈佛大學的師生聚集在一起,自我培訓如何從政府網站保存公共衛生數據。2 月創建的「數據拯救項目」(Data Rescue Project)負責協調一系列團體的備份行動,以追蹤進度,避免重複備份。根據該組織的記錄,目前已經有超 1030 個被刪除或受威脅的數據集備份完畢,範圍覆蓋疾控、住房、能源、教育、勞工等等。
但人們難以放鬆緊繃的神經。讓人憂心的是,即便過往的數據得以倖存,如果新的數據不再產生,那麼也難有現實意義。而數據收集是很難通過民間力量填補的。以 NOAA 的「十億美元天氣和氣候災害」數據庫為例,它的獨特之處不僅在於長時間的收集,更在於它提取了大多數科研機構和私立組織都無法訪問的非公開數據源,幾乎不可能被取代或複製。

刪除過去的數據就如同擦除人們的記憶。紐芬蘭紀念大學客座教授、 LGBTQ 歷史和女性研究學者 Alessio Ponzio 對 NPR 表示,「這是一種非常微妙的暴力行為,但真的能摧毀人們的心理。基本上就是在說,『我告訴你,我不認識你了』。」
而停止新數據的收集則會模糊人們對當下狀況的判斷。ProPublica 特別指出,即便是描繪了共和黨執政藍圖的「2025 計劃」,也並未建議政府撤銷數據收集。反而,在移民執法等領域,它還敦促政府在數據獲取上加大力度。這不得不讓人思考,如此大規模的數據刪除究竟是有何用意。ProPublica 認為,「當一個政府如此齊心協力地壓制對政府乃至整個社會的評估時,很難不得出這樣的結論:它對當前國家改革的有效性缺乏信心。」
trump is a shitty shit
为志愿者们感到骄傲❤️!