精選分類 書庫 完本 排行 原創專區
欣可小說 > 科幻 > 複仇星耀途 > 第16章:深藍的漣漪

複仇星耀途 第16章:深藍的漣漪

作者:墨靈葬花 分類:科幻 更新時間:2026-04-16 17:03:50

路容關掉資料分析軟體,螢幕暗下去,映出她平靜的臉。窗外,深港市的夜幕已經降臨,遠處寫字樓的燈光像繁星般亮起。她起身走到窗邊,看著這座城市的夜景。手機放在桌上,螢幕朝下。她知道,今夜會有資料流入測試環境,她設計的過濾規則將開始工作。那是一個精密的陷阱,偽裝成技術上的激進選擇。如果一切順利,明天清晨,告警就會觸發。如果失敗……路容沒有繼續想下去。她拉上窗簾,房間陷入昏暗。該休息了,明天還有更多戰鬥。

清晨六點四十七分,鬧鍾還沒響。

路容已經醒了。

她躺在床上,盯著天花板上模糊的陰影。出租屋的隔音不好,隔壁傳來衝馬桶的聲音,水管在牆壁裏發出沉悶的轟鳴。窗外有鳥叫,清脆而單調。空氣裏有灰塵和舊傢俱混合的氣味,還有她昨晚泡的茶已經涼透的淡淡茶香。

她坐起身,開啟床頭燈。

光線刺眼。

路容眯起眼睛,伸手拿過膝上型電腦。螢幕亮起,顯示著遠端連線界麵。她輸入密碼,登入星耀集團的測試伺服器。指尖在觸控板上滑動,點開監控麵板。

資料流統計圖在螢幕上展開。

藍色的曲線平穩上升,代表昨夜流入“深藍-預處理-加密”批次7資料包的數量。綠色柱狀圖顯示清洗流程各環節的處理量。紅色警示標誌——零。

沒有告警。

路容盯著螢幕,呼吸平穩。她關掉監控麵板,開啟郵件客戶端。收件箱裏有三封新郵件:一封是人力資源部的月度考覈通知,一封是公司食堂新選單,還有一封——

發件人:周哲。

主題:專案啟動會議,上午十點,線上。

路容點開郵件。

正文是標準的會議通知格式,列出了參會人員、會議連結、議程安排。附件裏有專案文件的更新版本。她下載附件,開啟文件。

文件第一頁是專案概述。

“深藍計劃外圍資料質量評估與預處理優化專案”

負責人:周哲(技術部)

質量評估專員:若溪(資料分析部)

資料來源:深藍-預處理-加密批次7、批次8、批次9

目標:建立標準化清洗流程,提升資料可用率15%以上

週期:四周

路容滾動滑鼠,瀏覽技術細節部分。

資料包加密方式:aes-256-gcm,金鑰輪換週期24小時。

資料結構:json巢狀,頂層欄位包括timestamp、device_id、event_type、payload。

payload欄位:加密內容,解密後為巢狀json,包含使用者行為序列、裝置指紋、互動事件。

她的目光停留在“payload欄位”的描述上。

手指無意識地敲擊桌麵。

一下,兩下。

三年前,天啟科技有一個內部專案,代號“燈塔”。那是她參與的第一個核心專案,負責設計使用者行為資料的采集和預處理流程。當時的加密方案也是aes-256,但用的是cbc模式。資料結構——她記得很清楚——也是json巢狀,頂層欄位包括timestamp、user_id、action_type、data。

data欄位,加密內容。

路容閉上眼睛,腦海裏浮現出那些程式碼片段。她寫過解析函式,寫過解密模組,寫過資料驗證規則。那些程式碼的風格,那些欄位命名的習慣,那些錯誤處理的邏輯……

她睜開眼,重新看向螢幕。

文件裏沒有更多細節。

但那種詭異的熟悉感,像一根細針,刺進她的記憶深處。

上午九點,路容洗漱完畢,換上簡單的灰色針織衫和黑色長褲。她在廚房燒水泡茶,茶葉在玻璃杯裏舒展開,顏色從淺綠漸漸變成琥珀。水蒸氣升騰,模糊了她的眼鏡片。她摘下眼鏡,用衣角擦拭。

手機震動。

周哲發來訊息:“會議提前到九點半,方便嗎?李總臨時要聽專案進展匯報,我們需要先內部過一遍。”

路容打字:“可以。”

“好,十分鍾後發你連結。”

路容端著茶杯迴到書桌前。出租屋很小,書桌緊挨著床,牆上貼著她手繪的資料流程圖和專案時間表。桌上除了膝上型電腦,還有一台外接顯示器、一個機械鍵盤、一個變聲器裝置。變聲器的指示燈亮著微弱的綠光,表示裝置待機。

她戴上耳機,調整麥克風位置。

然後開啟變聲器開關。

輕微的電流聲在耳機裏響起,隨即消失。裝置開始工作,將她原本的聲音實時處理成另一個頻率——略高,略帶沙啞,符合“若溪”這個身份的聲音特征。路容清了清嗓子,測試音效。

“測試,一,二,三。”

耳機裏傳出的聲音陌生而熟悉。

她喝了一口茶,茶水溫熱,帶著淡淡的苦味。

九點二十五分,會議連結發來。

路容點選進入。

視訊會議界麵展開。周哲已經線上,背景是星耀集團技術部的開放式辦公區,能看到他身後有同事走動的模糊身影。他穿著淺藍色襯衫,頭發梳理整齊,但眼睛下方有淡淡的黑眼圈。

“若溪,早上好。”周哲對著攝像頭微笑。

“早上好。”路容調整了一下坐姿,確保攝像頭隻拍到她的上半身和身後的白牆。

“其他同事馬上到。”周哲看了看螢幕側方,“李總要求十點聽匯報,我們抓緊時間過一下專案框架。你拿到資料包了嗎?”

“拿到了,昨晚下載的。”

“好。這批資料量比較大,加密方式也比之前的邊緣日誌複雜。”周哲開啟共享螢幕,展示技術文件,“aes-256-gcm,金鑰每天輪換,解密需要呼叫公司的金鑰管理服務。許可權我已經幫你申請了,今天下午應該能批下來。”

路容點頭:“我看到文件了。資料清洗流程的設計,我需要先瞭解現有問題。”

“問題很多。”周哲切換頁麵,展示一組統計圖表,“這是過去三個月‘深藍’外圍資料的可用率趨勢。藍色線是原始資料流入量,紅色線是清洗後可用資料量。你看,可用率一直在62%到68%之間波動,離我們目標的80%差很遠。”

圖表上,紅色曲線始終低於藍色曲線,兩條線之間的間隙代表被過濾掉的資料。

“過濾原因分析呢?”路容問。

周哲開啟另一張圖:“主要三大類:傳輸過程中產生的重複資料包,占比約18%;加密負載格式錯誤,無法解密,占比12%;資料欄位缺失或格式異常,占比8%。剩下的就是各種零星問題。”

“重複資料包的判定規則是什麽?”

“現有的規則很簡單:相同device_id、相同timestamp、相同payload雜湊值,判定為重複。”周哲說,“但問題在於,傳輸過程可能產生時間戳微秒級的差異,或者網路抖動導致同一個資料包被重複傳送但帶有不同的序列號。現有規則會漏掉很多。”

會議界麵裏又進來三個人。

都是技術部的同事,路容在之前的專案裏見過他們的名字,但沒直接合作過。他們依次打招呼,周哲簡單介紹了路容的角色。

“若溪負責設計新的過濾規則,重點解決重複資料包和格式異常的問題。”周哲說,“我們需要在兩周內拿出第一版方案,在測試環境跑通,然後逐步優化。”

一個戴眼鏡的男同事開口:“重複資料包的判定,我建議加入時間視窗概念。比如同一個device_id在100毫秒內傳送的多個資料包,如果payload相似度超過95%,就判定為重複。”

“相似度計算需要解密payload,計算成本很高。”另一個女同事反駁,“每天流入的資料量是tb級別,實時計算不現實。”

“可以抽樣,或者隻在可疑情況下觸發深度檢查……”

討論持續了二十分鍾。

路容大部分時間在聽,偶爾提問。她的問題都很精準,直指技術方案的核心矛盾和可行性邊界。周哲幾次看向她的視訊視窗,眼神裏有欣賞。

會議結束時,分工明確。

路容負責設計重複資料包過濾規則和異常資料檢測模組。技術部同事負責搭建測試環境,提供效能監控工具。周哲負責整體協調和向李劍匯報。

“若溪,你這邊需要什麽支援?”周哲問。

“我需要訪問最近一個月‘深藍’資料清洗的詳細日誌,包括每個被過濾資料包的具體原因、原始資料片段、處理時間。”路容說,“另外,我想瞭解這批資料的來源渠道,是直接采集還是通過第三方合作方獲取。”

周哲沉默了幾秒。

“日誌可以給你,下午開許可權。”他說,“但資料來源……這部分資訊涉密,需要副總裁級別審批。我盡量申請,但不保證。”

“理解。”路容點頭。

會議結束。

路容摘下耳機,關掉變聲器。房間裏瞬間安靜下來,隻有膝上型電腦風扇輕微的嗡嗡聲。她靠在椅背上,閉上眼睛。

腦海裏迴放著剛才會議的內容。

重複資料包。格式異常。加密負載。

還有周哲提到“資料來源涉密”時,那一瞬間的遲疑。

她睜開眼,開啟資料包。

解壓後的資料夾裏,是數百個加密檔案,每個檔案大小在幾十mb到幾百mb不等。檔名格式統一:deepblue_pre_enc_batch7_001.bin、deepblue_pre_enc_batch7_002.bin……

路容隨機選擇一個檔案,用公司提供的解密工具嚐試開啟。

工具彈出提示:“需要金鑰管理服務授權,請登入。”

她登入公司內網,進入金鑰管理平台。平台界麵簡潔,顯示著她已申請的許可權列表。其中一條:“深藍計劃批次7資料解密許可權——待審批”。

狀態:審核中。

路容關掉頁麵。

沒有解密金鑰,她無法檢視資料內容。但文件裏描述了資料結構,她可以基於這些描述,先設計過濾規則的框架。

她開啟程式碼編輯器。

手指放在鍵盤上,停頓。

然後開始敲擊。

程式碼一行行出現在螢幕上。她寫得很慢,每一個函式都仔細推敲,每一個判斷條件都反複斟酌。過濾規則的核心邏輯是:識別重複資料包,但不過度過濾;檢測格式異常,但不誤傷正常資料。

這需要平衡。

太保守,達不到提升可用率的目標。

太激進,可能誤過濾重要資料。

路容寫著寫著,停了下來。

她盯著螢幕上的程式碼,腦海裏浮現出另一個場景。

三年前,天啟科技“燈塔”專案。她也負責設計資料清洗流程。當時的專案負責人——一個四十多歲、總愛穿格子襯衫的技術總監——在評審會上說:“過濾規則要大膽一點,寧可錯殺,不可放過。使用者行為資料,幹淨比完整更重要。”

她當時反駁:“錯殺會丟失真實使用者行為模式,影響模型訓練。”

“那是演算法團隊該操心的事。”總監說,“我們的職責是提供幹淨的資料。”

後來,“燈塔”專案上線三個月後,因為資料過濾過度,導致使用者畫像模型出現嚴重偏差。產品團隊投訴,演算法團隊甩鍋,最後責任落到了資料清洗流程設計上。

而那個說“寧可錯殺”的總監,早已調離專案組。

路容深吸一口氣。

繼續寫程式碼。

但這一次,她的思路變了。

她開始設計一個“激進”的規則——表麵上是為了最大化過濾重複和異常資料,實際上,她在規則裏埋下了一個微妙的漏洞。

漏洞的核心,在於對加密負載格式的判定。

現有文件描述,payload欄位解密後應該是標準json格式,包含固定的幾個巢狀欄位。但路容知道,在實際傳輸過程中,可能因為加密演算法、網路編碼、第三方介麵等各種原因,產生一些非標準但依然可解析的變體。

比如,json字串的開頭或結尾多了一個空格。

比如,某個欄位的值是空陣列[],但被編碼成了空字串““。

比如,時間戳欄位的值是整數,但被錯誤地傳成了字串。

這些變體,在嚴格的json解析器裏會報錯,但在一些寬鬆的解析器裏可以正常處理。

路容設計的規則是:隻要payload解密後不能通過嚴格json解析驗證,就標記為“格式異常”,暫時擱置,觸發人工審核。

這聽起來很合理。

但她在規則裏加了一個細節:對於aes-256-gcm加密的資料包,解密過程會生成一個“認證標簽”,用於驗證資料完整性。如果認證標簽驗證失敗,解密工具會直接報錯,不會輸出任何內容。

而她的規則,在處理“認證標簽驗證失敗”的情況時,設計了一個特殊的邏輯分支。

這個分支會檢查資料包的後設資料——device_id、timestamp、來源ip——然後與最近一小時內的其他資料包進行模糊匹配。如果找到相似的資料包,就假設這個解密失敗的資料包是重複傳送的版本,直接丟棄,不觸發告警。

但如果找不到相似資料包呢?

規則會將其標記為“加密負載格式錯誤”,進入異常佇列。

然後——關鍵在這裏——路容在程式碼裏設定了一個閾值:同一來源ip在五分鍾內,如果出現超過三個“加密負載格式錯誤”的資料包,就觸發係統級告警。

為什麽?

因為正常的資料傳輸,不會在短時間內產生大量解密失敗的資料包。如果出現,要麽是源頭資料有問題,要麽是加密金鑰錯誤,要麽是——有人故意傳送了無法解密的測試資料。

而“深藍計劃”的資料來源,周哲說涉密。

路容不知道具體是什麽來源。

但她知道,李劍三年前構陷她時,用的就是偽造的資料包,偽裝成她從公司伺服器泄露出去的加密檔案。那些檔案,表麵上是aes加密,實際上內部結構被篡改過,解密後會得到錯誤的內容。

當時的加密方式,也是aes-256。

當時的錯誤模式,也是認證標簽驗證失敗。

當時的處理邏輯——天啟科技的安全團隊寫的——也是將這類資料包標記為異常,觸發告警。

然後告警記錄,成了“證據”的一部分。

路容的手指停在鍵盤上。

螢幕上的程式碼已經寫了三百多行。她從頭到尾檢查一遍,確認邏輯正確,確認漏洞隱蔽,確認這個規則在技術評審時能通過——因為它確實能有效過濾重複資料,也確實能檢測格式異常。

隻是,它會對某種特定的錯誤模式,產生“過度敏感”的反應。

而這種錯誤模式,與三年前她見過的,太像了。

下午兩點,許可權批下來了。

路容登入金鑰管理平台,看到狀態變成“已授權”。她下載瞭解密金鑰,匯入工具,重新嚐試開啟那個加密檔案。

進度條緩慢移動。

百分之十,百分之三十,百分之七十。

解密完成。

檔案展開,裏麵是數萬行json格式的資料。路容快速瀏覽,確認文件描述的結構準確:timestamp是13位毫秒時間戳,device_id是32位雜湊字串,event_type包括“page_view”、“button_click”、“scroll”等,payload欄位是加密內容。

她隨機選擇幾條資料,用金鑰解密payload。

解密後的內容顯示出來:使用者訪問了某個電商網站的商品頁麵,點選了“加入購物車”按鈕,頁麵停留時間47秒,滾動深度65%……

很標準的使用者行為資料。

路容連續解密了十幾條,內容都正常。

她關掉檔案,開啟另一個。

同樣正常。

第三個,正常。

第四個——

路容的目光停住了。

這條資料的device_id,她見過。

就在剛才解密的第一個檔案裏,有相同的device_id,但timestamp相差三分鍾。她翻迴去對比,兩個資料包的device_id完全一致,event_type都是“page_view”,但payload解密後的內容……

第一個:使用者訪問了網站a的首頁。

第四個:使用者訪問了網站b的商品頁。

同一個裝置,三分鍾內,訪問了兩個不同的網站。

這本身不奇怪,使用者可能切換應用。

但路容注意到一個細節:兩個資料包的來源ip不同。

第一個來源ip:203.112.89.76(深港市電信)

第四個來源ip:103.215.44.128(境外,新加坡)

同一個裝置,三分鍾內,ip地址從深港市跳到了新加坡。

不可能。

除非……

路容盯著螢幕,心跳微微加速。

除非這個device_id不是真實的裝置標識,而是經過某種對映或偽造的id。或者,資料來源本身就有問題——可能混合了多個渠道的資料,沒有做好去重和歸一化。

又或者,這些資料根本不是實時采集的,而是從某個資料倉儲裏批量匯出,重新打包加密後,偽裝成實時資料流。

她繼續檢視。

又發現了幾個類似的案例:相同的device_id出現在不同的來源ip,時間間隔很短,訪問行為不連貫。

還有一批資料,timestamp的時間順序是亂的——晚發生的事件,時間戳反而比早發生的事件更早。

以及一些payload解密後,json結構雖然正確,但某些欄位的值明顯異常:頁麵停留時間999999秒,滾動深度-1,按鈕點選坐標(9999,9999)……

路容把這些異常案例記錄下來。

然後,她開始修改過濾規則程式碼。

針對device_id異常跳變的情況,她加入了一個檢查:如果同一個device_id在十分鍾內出現在地理距離不可能達到的ip地址(比如深港市和新加坡),就將這兩個資料包都標記為“裝置標識可疑”,進入人工審核佇列。

針對timestamp亂序的情況,她加入時間戳合理性校驗:如果資料包的時間戳比係統當前時間還晚,或者比同來源的前一個資料包早太多,就標記為“時間戳異常”。

針對欄位值異常的情況,她加入數值範圍檢查。

每一條規則,都有合理的技術理由。

每一條規則,也都可能誤傷正常資料。

但路容把誤判的概率,控製在了一個“可接受”的範圍——根據她寫的測試用例,誤判率大約在0.3%到0.5%之間。對於tb級別的資料流,這意味著每天會有數萬個資料包被錯誤地標記為異常。

而係統告警的閾值,她設定為:同一資料來源,異常率超過1%,持續五分鍾,觸發告警。

如果她的規則誤判率是0.5%,正常資料流的異常率可能隻有0.1%或更低,那麽整體異常率不會超過0.6%,達不到告警閾值。

除非——

資料來源本身的異常率就很高。

或者,有人故意往資料流裏注入異常資料包。

路容寫完最後一段程式碼,儲存。

時間已經是下午六點。

窗外天色漸暗,城市的燈光再次亮起。她站起來,活動了一下僵硬的肩膀。頸椎發出輕微的哢噠聲。她走到窗邊,拉開窗簾。

深港市的夜晚,繁華而冷漠。

遠處星耀集團的寫字樓,依然燈火通明。不知道周哲還在不在辦公室,不知道李劍此刻在做什麽,不知道那些加密資料包,此刻正從世界的哪個角落,流向星耀的伺服器。

路容迴到書桌前,將程式碼提交到測試環境。

係統提示:程式碼審核中,預計兩小時內完成。

她關掉電腦。

煮了碗泡麵,加了雞蛋和幾片青菜。麵條在沸水裏翻滾,熱氣蒸騰,帶著濃鬱的調味料氣味。她端著碗坐在床邊,慢慢吃。

手機安靜地躺在桌上。

晚上八點,程式碼審核通過。

測試環境開始部署新的過濾規則。路容重新開啟電腦,登入監控麵板。資料流曲線平穩,清洗流程各環節正常。她的規則模組顯示“執行中”,處理計數開始累積。

晚上十點,處理資料量超過500gb。

異常標記數量:1274個。

異常率:0.25%。

低於告警閾值。

路容泡了第二杯茶,坐在電腦前等待。茶香在房間裏彌漫,混合著泡麵殘留的氣味。她戴上耳機,播放輕音樂,音量調得很低。

時間一分一秒過去。

晚上十一點。

異常率:0.31%。

晚上十一點半。

異常率:0.29%。

午夜十二點。

資料流進入低穀期,流入速度減緩。異常率波動,最高到0.35%,最低到0.22%。

路容的眼睛開始發澀。

她摘下眼鏡,揉了揉眉心。然後重新戴上眼鏡,盯著螢幕。

淩晨一點。

資料流突然出現一個小高峰——監控麵板顯示,有新的資料來源接入,流量在五分鍾內增加了30%。路容坐直身體,手指放在觸控板上,放大那個時間段的統計圖。

新資料來源的ip段:198.51.100.0/24。

地理位置:顯示為“未知”。

異常率,開始上升。

0.41%。

0.53%。

0.67%。

路容屏住呼吸。

螢幕上的數字跳動。

0.72%。

0.85%。

0.91%。

然後——

1.02%。

紅色警示標誌,在監控麵板上亮起。

係統告警觸發。

幾乎同時,路容的手機震動起來。

她拿起手機,螢幕上顯示來電:周哲。

路容盯著那個名字,看了三秒鍾。然後她深吸一口氣,按下接聽鍵,同時開啟變聲器。

“喂?”

“若溪,抱歉這麽晚打擾。”周哲的聲音從聽筒裏傳來,背景裏有鍵盤敲擊聲和輕微的警報聲,“測試環境出問題了,你設計的過濾規則,標記了一大批‘深藍’外圍資料為異常,現在資料流堵塞,清洗流程停滯。我需要你立刻遠端登入,一起排查。”

路容的聲音平靜:“異常率多少?”

“剛才峰值1.02%,現在降到0.98%,但還是高於閾值。”周哲說,“資料來源是198.51.100開頭的那個段,今晚剛接入的新渠道。你方便現在上線嗎?”

“方便,給我五分鍾。”

“好,我發你緊急訪問連結。”

電話結束通話。

路容放下手機,看向電腦螢幕。

紅色警示標誌依然亮著。

監控麵板上,異常資料包的數量還在緩慢增加。

她端起已經涼透的茶,喝了一口。

茶很苦。

但她的嘴角,微微揚起。

魚餌,已經放下。

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報