精選分類 書庫 完本 排行 原創專區
欣可小說 > 純愛耽美 > 回檔:換個姿勢再來一次 > 第1811章 哥,你什時候來的?

晨光不是一下子潑進來的,而是像一種極淡的、摻了灰的檸檬黃,先洇濕了東邊天際線那些鋸齒狀的屋頂與教堂尖頂,再緩緩漫過阿勒格尼河麵尚未散儘的、牛奶般的霧氣。

曹鵬租住的肖雷鎮一棟老磚牆公寓樓的頂層,朝東的窗玻璃上,爬山虎肥厚的葉子將光線濾成細碎而晃動的綠斑,在他合著的眼皮上溫柔地騷動。

五點四十七分,比鬨鍾早了十三分鍾,他的生物鍾精確得像經過梯度下降優化過的演算法。

躺著冇動,閉眼在腦中覆盤昨晚推導到一半的稀疏表示模型。那些符號在黑暗裏自動排列組合,如自律的士兵。三分鍾後才睜開眼,起身,赤腳踩在微涼的地板上。

單人床、書桌、書架、三台並排的顯示器、地板上蜿蜒的數據線纜和摞起來的專業期刊,構成了這個不足十五平方米空間的全部秩序,被曹鵬整理得像一篇邏輯嚴謹的論文。

窗台上的那盆綠蘿在晨光中舒展著肥厚的葉片,這是曹鵬從學校實驗室裏救回來的,如今已蔓生出近一米長的氣根,像一道綠色的瀑布垂著。

書桌左邊堆著三摞論文列印稿,每摞都用不同顏色的便利貼做了標記:藍色是待精讀,黃色是需要重驗推導,紅色則是存疑待討論。一台顯示器上開著一個終端視窗,一行行代碼正以某種催眠般的節奏向上滾動。

書架按領域分層,最上層是統計學習理論經典,中層是近年頂會論文集,下層是些“雜書”,《莊子》、《圍棋定式大全》、《哥德爾、艾舍爾、巴赫》。

拉開那扇有些滯澀的窗戶。匹茲堡夏日清晨特有的空氣湧了進來,並不清新得過分,帶著河流的水汽、遠處尚未關閉的鋼廠一絲微弱的硫磺暗示,以及這個老工業城市在清晨舒展筋骨時撥出的、混合了磚石、瀝青和茂密植被的複雜體味。

遠處,卡內基梅隆大學校園那些現代與古典雜糅的建築輪廓,在漸亮的天光中逐漸清晰。

一個深呼吸,走到小廚房,燒水,從鐵罐裏捏出李樂給的剩的不多的茶葉。等待水開的間隙,他做了一套自創的“喚醒操”,其實隻是緩慢轉動頸椎和肩關節。

長期編程的人,頸椎是阿喀琉斯之踵。水沸了,沖茶,看蜷曲的葉片在玻璃杯裏舒展成完整的春天。

六點整,曹鵬坐到電腦前,先花十分鍾瀏覽arXiv上新掛的預印本。此時計算機視覺領域正處在變革前夜,支援向量機仍是主流,但已有零星論文開始討論“多層神經網絡”在圖像識別上的潛力。

他快速掃過摘要,標記出三篇值得細讀的,拖進待讀檔案夾。這個動作他做了四年,檔案夾如今有1176篇文獻,每篇都經他標注、分類、交叉引用。

知識圖譜在他腦中自行構建,如城市地下管網般錯綜卻有序。

七點,起身煮燕麥粥,加一勺蜂蜜、幾顆核桃。吃飯時,他翻開筆記本,本子上是昨夜睡前草就的證明思路:關於如何將流形學習嵌入到卷積結構的初始化策略中。

字跡瘦勁,公式與文字交錯,邊緣處有小小的問號和待驗證的引理編號。他看了一會兒,在某個等號旁打了個叉,重寫。粥喝完時,證明已補全。

七點半,沖澡,換上灰T恤和卡其褲,匹茲堡的七月潮濕悶熱,但實驗室的空調總是開到需要穿外套。

出門前,他看了眼牆上釘著的照片,和姐姐曹豔、奶奶一起在清大二門下的合影,和其其格手拉手,坐在長城台階上的笑臉,左手抱著李笙、右手托著李椽,在石榴樹下夠石榴的瞬間,一張他與拉吉·瑞迪的合照,去年在NIPS會場,那位圖靈獎得主摟著他的肩,笑得像個發現寶藏的孩子。

最後一張,是李樂一手摟著自己肩膀,一手摁著李家成的腦袋,站在坐在沙發上的李晉喬和曾敏身後的靦腆,曹鵬嘴角彎了彎,背上包,鎖門。

七月的匹茲堡有種特別的靜謐,本科生大多已經離校,校園裏隻剩下研究生和暑期項目的中學生。

曹鵬騎著一輛不知道幾手的自行車騎向Gates Center,途經梅隆學院的老樓,紅磚牆上爬滿常春藤。

有軌電車叮噹駛過,晨跑的人喘著粗氣與他擦肩。騎得不快,腦中卻在模擬今天組會可能出現的辯論,關於他提出的“多尺度稀疏編碼用於圖像分類”的方案。這個想法萌芽於三週前與實驗室來自大毛的博士後捷爾任斯基的一次深夜討論,經過十幾次迭代,如今已初步成型。

不過組裏那個一看就是婆羅門長相的胖子維傑總愛質疑,喜歡用“計算複雜度”說事。

好在準備了三組對比實驗數據和兩個簡化模型的變體,足以應對任何詰問。但他希望不必用上全部彈藥,好的合作該像交響樂,而非軍備競賽。

把車子停到計算機學院那座標誌性的“機器人廳”門口時,他瞥見裏麵幾個本科生模樣的學生正圍著一個六足機器人調試代碼,動作中透著暑期實習特有的那種既興奮又疲憊的混合感。

本小章還未完,請點擊下一頁繼續後麵精彩內容!

“曹!”

一個聲音從身後傳來。曹鵬回頭,看見胖子維傑小跑著趕上來,手裏還捏著一個吃了一半的甜甜圈。

“昨晚又睡在實驗室了?”

“演算法收斂前的最後一組實驗,”維傑咧嘴一笑,露出被咖啡漬略微染黃的門牙,“我賭我的新特征選擇方法能在Caltech-101上比你的方法高至少兩個百分點。”

“賭什麽?”

“輸了的人吃一週的咖哩。”

“這不公平,你可以一輩子吃咖哩糊糊。”

“那你說。”

“辦公室一週的衛生。”

“行.....行吧。”

兩人走進蓋茨計算機科學中心時剛好八點十五分。電梯裏貼著幾張海報:下個月將在西雅圖召開的CVPR會議征稿通知,卡內基梅隆與英特爾合作研究項目的招聘啟事,還有一張,瑞迪教授不知道又獲得什麽獎項的新聞剪報。

項目組會議室在五樓東側。兩人推開門時,裏麵已經坐了三四個人。

長條會議桌一端,瑞迪教授正低頭翻閱著一遝列印稿,鼻梁上架著那副標誌性的半框眼鏡。這位圖靈獎得主今天穿了件淺藍色的牛津紡襯衫,袖子挽到手肘,露出小臂上濃密的汗毛。

“曹,你的報告在第三個,”瑞迪頭也不抬地說,“我希望看到完整的誤差分析,而不僅僅是準確率數字。”

“明白,教授。”

曹鵬坐到最邊上,從包裏取出筆記本電腦和一份列印好的資料。他習慣紙質備份,在這個PDF和PowerPoint已經普及的年代,這顯得有些老派,但他喜歡在匯報時用鉛筆快速標注重點的感覺。

組會準時開始。第一個匯報的是博士三年級生艾米麗·陳,一個除了姓氏,其他各方麵已經和華裔都不沾邊的女生,包括長相,畢竟,作為第一批來到醜國的華工後代,你要相信基因的力量。

她做的是基於主動輪廓模型的醫學圖像分割。匯報到一半時,瑞迪打斷了她。

“你的能量函數中正則項係數是固定的?”

“是的,目前是0.3。”

“試過自適應調整嗎?根據圖像區域性梯度?”

艾米麗愣了一下,“這……會增加計算複雜度。”

“先驗證有效性,再優化效率。”瑞迪的語氣平和,卻帶著不容置疑的權威,“下週三之前,給我三組對比數據。”

曹鵬低頭在自己的筆記本上快速記下一行字,“正則項自適應,可用於多尺度特征權重分配?”他的思維總是這樣,即使在聽別人的匯報,也會下意識尋找與自己課題的交叉點。

第二個匯報的就是胖子維傑。

他提出了一種基於互資訊的特征選擇方法,用於降低高維特征空間中的冗餘。

匯報過程中,曹鵬三次舉手提問,一次關於互資訊估計中核函數帶寬的選擇依據,一次關於該方法在類別不平衡數據集上的魯棒性,還有一次關於計算複雜度的實際評估。

每次提問都朝著要害而去。維傑的回答起初還遊刃有餘,到第三個問題時,額頭已滲出細密的汗珠。

“計算複雜度方麵,”維傑翻動著幻燈片,試圖找到相應的分析頁麵,“理論上是O(n2),但實際實現中我們采用了近似演算法……”

“近似演算法的誤差界是多少?”曹鵬追問。

會議室安靜了幾秒。瑞迪抬起頭,目光在兩人之間掃過,嘴角似乎微微上揚了一毫米—,這是他對學生間高質量辯論的認可。

“這……我們還在分析。”維傑最終承認。

“那麽在你的實驗結果中,至少應該標注‘使用近似演算法’的說明。”曹鵬的語氣冇有得意,隻是陳述事實,“否則對比是不公平的。”

維傑點頭坐下時,曹鵬對他眨了眨眼,這是兩人之間的默契,辯論歸辯論,不影響午飯時一起吐槽係裏新出台的服務器使用規定。

瑞迪教授朝曹鵬點頭,“上週我們討論了SIFT特征在動態場景中的漂移問題。曹鵬提出了一個新框架的初步想法。今天,請他詳細展開。”

曹鵬起身,在靠近白板的位置坐下,他冇用投影,有些思路,手寫更能體現思考的脈絡。

“謝謝教授。”他轉向小組,目光掃過每個人的臉。

維傑抱著手臂,眉頭微皺,艾米麗已打開筆記本,二年級博士生湯姆眼神放空,大概還冇從昨晚的Dota戰中回神,而博士後捷爾任斯基,則衝曹鵬眨眨眼。

“我們現有的圖像分類流程:特征提取、編碼、池化、分類器。”曹鵬畫了四個方框,“問題在於,手工設計的特征,比如SIFT....在類別增多、視角變化劇烈時,區分度下降。而編碼階段用的K-means或稀疏編碼,本質是假設特征服從單一分佈。”

說到這兒,他等等,看是否有人提問。維傑動了動嘴唇,但最終選擇放棄。

“我的提議是,放棄手工特征,直接從畫素學起。”曹鵬在“特征提取”框上打了個叉,“但不是用傳統的全連接神經網絡,參數量太大,且忽略圖像的空間區域性性。我設計了一個多尺度稀疏自編碼器結構。”

這章冇有結束,請點擊下一頁繼續!

他又在白板上畫出三層結構,第一層是小感受野的卷積核,提取邊緣紋理,第二層卷積核變大,整合區域性結構,第三層是全連接層,但施加L1稀疏約束。每一層都用無監督預訓練初始化,再用反向傳播微調。

“關鍵在這裏,”曹鵬在第三層旁寫下公式,“我們不在畫素空間做稀疏,而是在特征空間做。將每張圖的特征啟用視為一個信號,用字典學習找到過完備基,然後求解稀疏係數。”

“這樣,分類問題轉化為,在字典空間中找到最具判別力的稀疏模式。”

說著,寫下一串數學符號。然後轉向實際問題,“我在Caltech101數據集上試了初步版本。64×64的圖,三層結構,第一層用6×6卷積核,步長2,得到16個特征圖;第二層……”

“等等。”維傑終於舉手,語氣帶著質疑,“曹,你算過時間複雜度嗎?光是第一層卷積,假設輸入是64×64的RGB圖,6×6核,步長2,輸出16個特征圖,一次前向傳播就需要多少乘加操作?這還冇算上稀疏編碼的迭代優化。你的模型能在合理時間內完成訓練嗎?”

問題尖銳,但曹鵬預料到了。他保持平靜,甚至微笑。

“好問題。我算過。”他走到白板另一側,快速寫下算式,“第一層卷積,輸入64×64×3,核6×6×3×16,步長2,輸出特征圖尺寸30×30×16。乘加次數約:(6×6×3)×(30×30)×16 = 1,555,200次。對於Caltech-101的9144張圖,一個epoch是142億次操作。在雙Xeon 3.0GHz的服務器上,用高度優化的C++和SSE指令,一個epoch大約需要47分鍾。”

數字精確到個位。會議室安靜了。

“但這隻是樸素實現。”曹鵬繼續,“我做了三處優化,一,將卷積轉化為矩陣乘法,用Strassen演算法加速,二,利用特征圖之間的獨立性,並行計算。三,稀疏編碼階段,我用了改進的迭代收縮閾值演算法,將收斂速度提升了40%。最終,完整訓練一輪的時間是28分鍾,在可接受範圍內。”

維傑盯著算式,手指無意識敲著桌麵。幾秒後,他抬頭,“準確率呢?你說了這麽多計算,但分類效果比SIFT+SPM的空間金字塔匹配好多少?”

“Caltech-101,SIFT+SPM的最好結果是78.3%。”曹鵬抽出列印好的圖表,貼在白板上,“我的方法,在相同訓練、測試劃分下,目前是81.7%。錯誤分析顯示,提升主要來自動物類和交通工具類。”

“這些類別視角變化大,手工特征容易失效。”

3.4個百分點的提升,在視覺領域已算顯著。艾米麗輕聲讚歎,湯姆也坐直了身體,隻有捷爾任斯基,小聲的吹了個口哨。

但維傑還冇放棄,“你的模型參數量多大?過擬合風險呢?”

“參數量,卷積層約1.7萬,全連接層約12萬,總計不到14萬。作為對比,一個三層的全連接神經網絡,輸入是64×64×3=維,隱層若取500單元,參數量就超過600萬。”

曹鵬從容應對,“至於過擬合,我用到了數據增強,平移、旋轉、縮放、Dropout,以及在損失函數中加入權重衰減。五折交叉驗證的方差在0.8%以內。”

滴水不漏。維傑靠回椅背,終於露出一絲苦笑,“行吧,看來你都考慮到了。”

“不,還有問題。”曹鵬忽然說。所有人都看向他。他指向白板上的一處,“稀疏編碼的字典學習,我目前用的是在線梯度下降,但初始化敏感。我試了KSVD和MOD,效果都不穩定。”

“這是我今天想請教大家的:有冇有更好的字典初始化策略?或者,我們是否該換一種思路,不學固定的字典,而學一個能生成字典的函數?”

問題拋回給小組。一直沉默的瑞迪教授此時開口,聲音裏帶著讚許,“很棒的思考,曹。字典初始化……讓我想到非線性降維中的區域性線性嵌入。或許可以將LLE的鄰域重構思想遷移過來,用區域性樣本的線性組合初始化字典原子。”

討論就此轉向更深的技術細節。維傑出用拉普拉斯特征對映約束字典原子的平滑性,艾米麗建議在損失函數中加入判別性項。湯姆貢獻了一個CUDA加速的idea。雖然實現細節有待商榷。

曹鵬聽著,不時點頭,在筆記本上記錄。辯論時的鋒芒收起了,此刻他是海綿,吸收每一點有用的靈感。當艾米麗提出一個巧妙的正則化方法時,他眼睛一亮,迅速推演了幾步,抬頭說,“這個可以和我之前想的流形約束結合。”

“如果我們把特征空間視為黎曼流形,你的正則化項其實就是對流形曲率的懲罰。艾米麗,會後能詳細聊聊嗎?”

這章冇有結束,請點擊下一頁繼續!

艾米麗笑著點頭。

維傑插話,“曹,你總能把不同領域的東西縫在一起。上次是稀疏編碼和視覺注意力,這次是流形幾何。你的腦子怎麽長的?”

“多讀書。”曹鵬認真回答,“《微分幾何基礎》和《壓縮感知理論》一起讀,有時候會在淩晨三點產生奇怪的聯想。”

眾人都笑了。

瑞迪教授看著弟子們,眼神欣慰。他喜歡這種氛圍,嚴謹但不死板,競爭卻又合作。

曹鵬尤其讓他驚喜,不僅天賦驚人,更難得的是懂得如何將鋒芒包裹在謙遜之下,在扞衛自己觀點時不傷及同僚自尊,在吸收他人意見時不忘真誠致謝。

會議在十一點半結束。曹鵬被圍住,回答關於代碼實現的問題。他耐心解釋,答應晚點把優化後的卷積覈計算代碼分享給大家。

出門時,維傑走到他身邊,拍拍他肩,“今天又被你碾壓了,曹。不過那個字典初始化的問題,我昨晚其實有點想法……”

“一起吃午飯?我想聽聽。”曹鵬自然而然地接話,彷彿剛纔的激烈交鋒從未發生。

兩人並肩走向食堂。

窗外,匹茲堡的天空湛藍如洗,幾朵白雲停在卡內基梅隆大學紅色屋頂的上空,像在等待什麽。

曹鵬想著下午要跑的對比實驗,腦中已開始規劃代碼結構。但此刻,他更願意聽維傑說話。誰知道呢?也許“有點想法”,能點亮下一盞燈。

走在橡樹掩映的小徑上,他忽然想起昨夜筆記本邊緣寫下的一句自語,“演算法如棋,妙手偶得,但妙手之前,是十年厚積。”

他笑了笑,推開了食堂的門。冷氣混合著意麪醬的香氣撲麵而來,而他的思緒,已飄向下午將要書寫的、那些無人見過的代碼行。

隻不過,當看到一個人高馬大,正嘬著一杯可樂,迎麵的朝自己走來的圓寸腦袋的時候,那笑容忽然變得激動起來。

“哥,你什麽時候來的?”

喜歡回檔:換個姿勢再來一次請大家收藏:()回檔:換個姿勢再來一次書海閣網更新速度全網最快。

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報