加入收藏 設為首頁 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號貴都國際中心A座1111室
在智算中心內(nèi)部,一排排高密度部署的AI服務器不間斷地進行著計算,散發(fā)出遠超過傳統(tǒng)數(shù)據(jù)中心的熱量。當冷板內(nèi)的液體將芯片熱量帶出機柜后,這些載熱液體匯聚到一組亮著指示燈的金屬柜體——冷卻液分配單元,它安靜卻至關(guān)重要地維系著整個液冷系統(tǒng)的有序運行。
一、CDU:連接服務器與基礎設施的核心樞紐
CDU是Coolant Distribution Unit的縮寫,中文譯為冷卻液分配單元。在智算中心的液冷系統(tǒng)中,它扮演著承上啟下的“交通樞紐”和“管理中樞”角色。
從功能上看,CDU位于一次側(cè)(機房級冷源)和二次側(cè)(服務器內(nèi)部冷卻循環(huán))的交界處。它的核心任務包括:
1. 流量與壓力分配:將一次側(cè)提供的冷卻介質(zhì),按需分配至各個機柜或服務器集群,確保每個冷卻支路獲得穩(wěn)定、均衡的流量和壓力。
2. 系統(tǒng)隔離與保護:通常通過板式換熱器,將一次側(cè)回路與二次側(cè)回路物理隔離開。這種設計允許兩個回路使用不同的工質(zhì),例如一次側(cè)使用價格低廉的軟化水或乙二醇水溶液,而二次側(cè)則使用絕緣性更好的去離子水或?qū)S秒娊橘|(zhì)液體,既保障了接觸服務器部件的安全,也降低了運行成本。
3. 監(jiān)控與調(diào)節(jié):持續(xù)監(jiān)測冷卻液的溫度、壓力、流量和電導率等關(guān)鍵參數(shù),并可通過調(diào)節(jié)泵頻、閥門開度或與一次側(cè)冷源通信,實現(xiàn)對冷卻效果的動態(tài)控制。
可以這樣理解:如果說服務器冷板是貼近熱源的“毛細血管”,那么CDU就是控制整個肢體血液(冷卻液)供回與健康的“心臟瓣膜與中書神經(jīng)系統(tǒng)”。
二、系統(tǒng)架構(gòu):多模塊協(xié)同的工程體
一臺功能完備的CDU是一個高度集成的模塊化系統(tǒng),其內(nèi)部架構(gòu)通常包含以下幾個關(guān)鍵部分:
動力模塊(泵組):這是系統(tǒng)循環(huán)的“心臟”。通常采用變頻冗余泵設計(如“一用一備”或“兩用一備”),確保在任何單一泵故障時,系統(tǒng)仍能維持冷卻液不間斷地輸送至服務器。變頻控制則可根據(jù)實際熱負荷調(diào)節(jié)流量,起到節(jié)能作用。
換熱模塊(板式換熱器):這是實現(xiàn)冷量交換、隔離兩側(cè)回路的核心“器官”。一次側(cè)冷源(來自冷水機組或自然冷卻系統(tǒng))的低溫介質(zhì),與從服務器回來的二次側(cè)高溫介質(zhì)在此進行GAO效換熱,將熱量帶走。其換熱效率直接影響整個系統(tǒng)的冷卻能力和能耗。
過濾與補水模塊:相當于系統(tǒng)的“腎臟與水平衡系統(tǒng)”。精細過濾器用于持續(xù)清除二次側(cè)回路中因腐蝕、雜質(zhì)等產(chǎn)生的顆粒物,保護服務器冷板內(nèi)狹窄的微通道不被堵塞。自動補水單元則用于補充因微滲漏等損失的冷卻液,維持系統(tǒng)壓力穩(wěn)定。
監(jiān)測與控制模塊:這是CDU的“大腦”。它集成了溫度、壓力、流量、液位、電導率等多種傳感器,并通過可編程邏輯控制器或?qū)S每刂破,實現(xiàn)數(shù)據(jù)采集、邏輯判斷與自動控制。所有信息通常上傳至數(shù)據(jù)中心基礎設施管理系統(tǒng),實現(xiàn)集中監(jiān)控。
管路與閥門模塊:構(gòu)成系統(tǒng)的“血管網(wǎng)絡”。包括主管路、各支路分配管、手動/電動調(diào)節(jié)閥、關(guān)斷閥、排氣閥等,用于冷卻液的輸送、分配、流量調(diào)節(jié)及系統(tǒng)維護時的隔離。
三、主要類型:主動式與被動式的路徑選擇
根據(jù)CDU內(nèi)部二次側(cè)循環(huán)的動力來源和控制方式,可將其分為兩大類型,其選擇直接影響系統(tǒng)的架構(gòu)和特性。
1. 主動式CDU
這是目前智算中心的主流選擇。其蕞大特點是CDU內(nèi)部集成有變頻泵組,主動為二次側(cè)冷卻回路提供循環(huán)動力。
工作模式:CDU內(nèi)的泵從二次側(cè)回液管吸入被服務器加熱的冷卻液,加壓后泵送至換熱器降溫,再將冷卻后的液體輸送至服務器冷板。
優(yōu)點:控制能力強?梢詼蚀_控制二次側(cè)的總供液壓力、流量和溫度,不受一次側(cè)壓力波動的影響。通過調(diào)節(jié)泵頻,能很好地適應服務器負載變化,實現(xiàn)動態(tài)節(jié)能。易于擴展,可通過增加泵或CDU來應對未來機柜的增加。
考量點:系統(tǒng)相對復雜,初投資和泵本身的能耗是成本的一部分。對泵的可靠性要求高,需做好冗余設計。
2. 被動式CDU
也稱為“泵驅(qū)式”或“一次側(cè)泵驅(qū)”。在這種架構(gòu)下,CDU內(nèi)部不設二次側(cè)循環(huán)泵,二次側(cè)的循環(huán)動力完全依賴于一次側(cè)循環(huán)泵提供的壓力差。
工作模式:一次側(cè)高壓流體通過CDU內(nèi)的換熱器,將冷量傳遞給二次側(cè)流體,并依靠此壓力差推動二次側(cè)流體流向服務器。CDU在此主要起分配和換熱作用。
優(yōu)點:系統(tǒng)結(jié)構(gòu)簡化,減少了CDU內(nèi)的運動部件(泵),理論上潛在故障點減少,可靠性可能提升。同時,也避免了二次側(cè)泵的能耗。
考量點:系統(tǒng)控制靈活性降低,二次側(cè)流量和壓力受一次側(cè)系統(tǒng)影響較大。對一次側(cè)泵的揚程和整個管網(wǎng)水力平衡設計提出更高要求。在應對局部負載劇烈變化或進行系統(tǒng)擴展時,調(diào)整可能不如主動式靈活。
四、選型與應用要點:匹配場景的系統(tǒng)性思考
為智算中心選擇CDU,需要超越單一設備參數(shù),進行系統(tǒng)性匹配分析。
與制冷架構(gòu)和工質(zhì)的匹配:這是首要前提。需要明確是一次側(cè)采用水冷、冷凍水還是自然冷卻方案,從而確定CDU換熱側(cè)的接口與參數(shù)。同時,須根據(jù)服務器冷卻方式(冷板式/浸沒式)及供應商要求,明確二次側(cè)冷卻工質(zhì)的類型(去離子水、特種冷卻液等),這決定了CDU內(nèi)部材料兼容性及監(jiān)測要點(如對水電導率的監(jiān)控)。
容量與冗余配置:CDU的制冷容量(通常以kW計)和流量須覆蓋其下聯(lián)所有服務器在蕞壞情況下的總熱負荷,并留有余量。其泵組、電源、控制器等關(guān)鍵部件須具備冗余能力,滿足智算中心對高可用性的要求。常見的部署模式是“N+1”CDU集群,為整個液冷機柜區(qū)提供冗余。
控制邏輯與智能化水平:好的CDU應能實現(xiàn)與服務器負載的聯(lián)動。例如,接收服務器入口水溫信號或與數(shù)據(jù)中心基礎設施管理系統(tǒng)協(xié)同,動態(tài)調(diào)節(jié)二次側(cè)供液溫度或流量,在保障散熱安全的前提下,盡可能提高一次側(cè)自然冷卻的利用時間,優(yōu)化整體能效。
可維護性與空間布局:智算中心業(yè)務連續(xù)性強,CDU需支持在線維護(如過濾器的更換、泵的切換)。其尺寸、接口位置、重量等物理特性,須與機房承重、通道、管道預留位置等現(xiàn)場條件相匹配。模塊化設計的CDU在部署和后期擴容上通常更具優(yōu)勢。
全生命周期成本:選型時需綜合評估初投資、安裝成本、運行能耗、維護成本及可能的升級成本。一個能效更高、可靠性好、維護簡便的CDU,雖然初期投入可能較高,但在長期的運營中可能更具價值。
隨著智算中心朝著更高密度、更大規(guī)模的方向發(fā)展,CDU作為液冷系統(tǒng)的核心調(diào)度節(jié)點,其重要性愈發(fā)凸顯。未來的CDU將向著更高集成度、更精細化的智能控制、更開放的標準化接口演進,并與AI能效管理平臺結(jié)合,從“被動響應”走向“主動優(yōu)化”,持續(xù)為澎湃的AI算力提供冷靜、可靠的基礎環(huán)境保障。