精選分類 書庫 完本 排行 原創專區
欣可小說 > 古代言情 > 大白話聊透人工智慧 > 商湯大裝置算電協同:給智算中心裝“智慧能源大腦”

商湯在第二十屆中國IDC產業年度大典上分享的算電協同實踐,說白了就是給智算中心這個“AI算力工廠”解決了用電的大難題——現在跑大模型的智算中心就是個巨型“電老虎”,不僅耗電多、電費貴,還經常因為電力供應不穩導致算力任務中斷。商湯靠一套“能源大模型+智慧儲能係統”的組合拳,讓算力和電力精準配合,實現了“算隨電用、電隨算動”,既降了成本,又保了穩定,還貼合了“雙碳”目標,下麵就用最接地氣的話把這事拆明白。

一、為啥智算中心非得搞“算電協同”?——電力已經成了AI發展的“卡脖子”難題

現在AI大模型越做越大,訓練一個千億參數的模型,需要成千上萬的服務器連軸轉,這些服務器堆在一起的智算中心,就是個實打實的“電老虎”。但行業裡一直有兩個繞不開的用電痛點,不解決的話,AI算力想發展根本無從談起。

1.數據“各玩各的”,電力浪費嚴重

智算中心裡有三類關鍵數據:一是AI訓練任務的數據,比如今天要跑視頻生成模型、明天要做數據分析;二是服務器集群的負載數據,比如現在有多少服務器在乾活、負載有多高;三是電力調度的數據,比如電網什麼時候電價便宜、什麼時候綠電(風電、光伏)多、電網能提供多少電力。

但現在這三類數據就像三個互不搭理的“部門”,電力係統不知道智算中心接下來要乾啥、需要多少電,智算中心也不知道電網的電力情況,隻能“瞎用電”。比如電網深夜電價低、綠電充足時,智算中心的算力任務可能正處於低穀,白白浪費了便宜電;而白天電網用電高峰、電價高時,智算中心又剛好要跑大模型,需要大量電力,不僅電費飆升,還可能因為電網供電不足導致任務中斷。這種數據孤島,讓智算中心的電力使用效率大打折扣,錢花了不少,還冇辦好事。

2.電力波動太坑,算力穩定冇保障

大模型訓練和推理時,算力負載就像坐過山車,可能上一秒還很平穩,下一秒因為要處理海量數據,負載突然飆升,瞬間需要巨量電力。電網的供電能力是相對固定的,根本跟不上這種“尖峰需求”,很容易導致服務器電壓不穩甚至宕機,辛苦跑了幾天的大模型訓練任務可能直接歸零,損失難以估量。

反過來,當算力任務進入低穀,服務器負載驟降,智算中心的電力需求也跟著減少,這時候電網的電力又冇處用,造成資源閒置。而且現在國家在推“雙碳”目標,智算中心作為高耗能場所,要是不能降低能耗、減少碳排放,後續發展也會受政策限製。

3.全球都在搶賽道,這是國家層麵的戰略佈局

不隻是國內有這問題,全球科技強國都在盯著“算力-能源”一體化的佈局。比如美國的大數據企業Palantir推出了“ChainReaction”平台,把它定位成“美國人工智慧基礎設施的操作係統”,核心就是把算力調度、電力預測和晶片管理揉到一起,打造國家級的AI基礎設施。商湯搞算電協同,不隻是為瞭解決自己智算中心的運營問題,更是在國家戰略層麵,補齊我國AI基礎設施的能源短板,避免在全球AI競爭中落後。

二、商湯怎麼破解難題?——兩大核心抓手,讓算力和電力“心有靈犀”

商湯冇有簡單地給智算中心裝個電錶或者買個充電寶,而是從底層邏輯入手,打造了“能源大模型+智慧儲能係統”的閉環,讓算力和電力能雙向適配,真正實現“算隨電用、電隨算動”。

1.能源大模型:智算中心的“電力預言家+總調度”

商湯自研的能源大模型,就像給智算中心裝了個超級聰明的大腦,既能精準預測未來的電力需求,又能實時指揮電力怎麼用,核心靠三個獨門絕技。

(1)把所有數據串起來,實現“任務-算力-功耗”精準對應

以前智算中心的任務、算力、功耗數據是割裂的,現在商湯通過獨創的“能量塊”數據模型和“算電功耗模型”,把這些數據全打通了。比如跑一個千億參數的多模態大模型,能源大模型能精準算出需要啟動多少台服務器、每台服務器每小時耗多少電、整個算力集群的總功耗是多少,甚至能對應到配電係統的每一條線路。

簡單說,隻要輸入一個算力任務,能源大模型就能立刻算出“要花多少電”,就像你點外賣時,APP能精準算出配送時間和費用一樣,再也不用“盲猜”電力需求了。

(2)“能量塊”加持,複雜場景也能精準預測

為了讓預測更準,商湯把能源本身的數據(比如風電、光伏的發電效率)、用戶的用能習慣(比如智算中心什麼時候跑大任務)、能源平衡規則(比如電網的供電限製),和算力服務器的資訊綁在一起,做成一個個“能量塊”,作為分析的基礎單元。

就像玩積木時,用不同的積木塊能拚出不同造型,這些“能量塊”能根據實際情況組合分析,再結合多輪訓練優化的演算法,哪怕遇到極端天氣(比如陰天光伏發電少)、算力任務臨時調整等複雜場景,能源大模型也能精準預測未來的能源需求。目前這個模型的能源需求預測準確率已經超過88%,決策準確率超93%,未來還能達到90%-95%的行業頂尖水平。

(3)高頻次動態調度,讓電力使用“利益最大化”

能源大模型不是一天隻預測一次,而是每15分鐘更新一次電力需求預測,每5分鐘調整一次調度策略,相當於每分鐘都在“精打細算”怎麼用電。

它會綜合考慮各種因素:比如電網的實時電價(低穀電便宜就多用電)、綠電比例(綠電多就優先用,貼合雙碳)、儲能係統的電量(儲能滿了就少充,儲能空了就補)、電網的供電要求(電網高峰就少用點),然後自動生成最優的調度策略。比如電網深夜電價低、綠電足,就安排跑算力密集型任務;白天電網高峰,就把非緊急任務暫停,用儲能係統的電支撐基礎算力,真正讓智算中心從“隻能被動用電的剛性負荷”,變成“能靈活調節的電力資源”。

2.聯合寧德時代做智慧儲能:智算中心的“超級充電寶”

光有預測和調度還不夠,得有實際的電力儲備來應對算力負載的突然波動,商湯找了寧德時代合作,打造了一個規模達17.888MW\/35.776MWh的儲能係統,相當於給智算中心裝了個超大號的“充電寶”,而且還是帶智慧大腦的。

(1)毫秒級響應,解決電力“瞬時缺口”

這個儲能係統最厲害的地方是響應速度快,能在毫秒級內釋放電力。比如智算中心的萬卡級服務器集群突然啟動,算力負載瞬間飆升,電網供電跟不上時,儲能係統能立刻補上電,就像汽車爬坡時渦輪增壓突然發力,保證服務器不會因為電力不足宕機,大模型訓練任務也能順利進行。

(2)分季節調模式,安全和效率兩手抓

這個儲能係統不是一成不變地充放電,而是會根據季節調整策略。在冬春秋季,智算中心的PUE(能耗效率指標,數值越低越節能)比較低,能耗壓力小,就用傳統的兩充兩放模式,簡單又高效;到了夏季,氣溫高導致PUE升高、電力冗餘少,就切換成能源大模型驅動的智慧調度模式,精準控製充放電節奏,確保係統在安全紅線內運行,不會因為過熱出問題。

(3)還能參與電力交易,賺額外收益

這個儲能係統不隻是個“備胎”,還能幫智算中心賺錢。它可以參與電網的削峰填穀:電網用電高峰時,把儲存的電賣給電網,賺差價;電網低穀時,再低價買電存起來,降低用電成本。同時還能參與電力市場交易,根據市場價格調整充放電策略,讓智算中心從“用電方”變成“電力市場參與者”,多了一筆額外收入。

三、實際效果咋樣?——上海臨港AIDC成“樣板間”,省錢又環保

商湯把這套算電協同方案落地在了上海臨港的智算中心,這也是全國首個5A級智算中心,實際運營效果特彆亮眼,成了行業裡的綠色智算中心“樣板間”。

1.能耗大幅降低:整體PUE降到了1.267,比最初的設計值還低3%。PUE這個數越低,說明智算中心的能源利用效率越高,1.267的水平在行業裡已經屬於頂尖了,全年還節電超過1000萬度,相當於少燒了幾千噸煤。

2.電費成本大減:年化電費成本節約了7%,對於動輒一年上億電費的智算中心來說,這可是一筆不小的開支,直接降低了AI算力的運營成本。

3.碳排放顯著減少:一年下來碳減排3000噸,實實在在地響應了國家的“雙碳”目標,讓AI發展不再以高汙染為代價。

4.獲得行業認可:這個智算中心還拿到了“2025年度中國IDC產業算電協同先鋒獎”,證明商湯的這套方案已經得到了行業的認可,具備複製推廣的價值。

四、這佈局對整個AI產業有啥意義?

商湯的算電協同實踐,不隻是解決了自己智算中心的用電問題,更給整個AI產業帶來了深遠的影響。

首先,降低了全行業的算力運營成本。智算中心是AI產業的基礎設施,電費是其最大的運營成本之一。商湯的方案能讓智算中心的電力使用效率大幅提升,電費成本下降,整個AI產業的算力成本都會跟著降低,中小企業也能更輕鬆地用上高階AI算力。

其次,推動了AI產業的綠色發展。通過綠電利用、儲能優化和能耗降低,讓AI技術的發展和環境保護實現了雙贏,避免AI成為新的高汙染產業,符合未來產業發展的趨勢。

最後,鞏固了我國AI基礎設施的優勢。在全球都在佈局“算力-能源”一體化的背景下,商湯提前掌握了核心技術,打造了可複製的算電協同範式,讓我國的AI基礎設施更自主、更高效,在全球AI競爭中占據了有利位置。

未來,隨著能源大模型和儲能係統的不斷優化,商湯的這套方案還會在更多智算中心落地,讓AI算力真正實現“高效、穩定、綠色”的發展,為整個AI產業的進步提供堅實的支撐。

目錄
設置
設置
閱讀主題
字體風格
雅黑 宋體 楷書 卡通
字體風格
適中 偏大 超大
儲存設置
恢複默認
手機
手機閱讀
掃碼獲取鏈接,使用瀏覽器打開
書架同步,隨時隨地,手機閱讀
收藏
聽書
聽書
發聲
男聲 女生 逍遙 軟萌
語速
適中 超快
音量
適中
開始播放
推薦
反饋
章節報錯
當前章節
報錯內容
提交
加入收藏 < 上一章 章節列表 下一章 > 錯誤舉報