Immersion Cooling - 浸沒式液冷是數據中心散熱的終極解決方案魔力門部落格

本文最後更新日期 : 2025-02-27 ，更新作者 : ZMAN

概覽

隨著人工智慧、高性能計算（HPC）和雲端運算的快速發展，數據中心的功率密度不斷攀升，傳統的風冷散熱技術已難以滿足現代數據中心的散熱需求。浸沒式液冷(Immersion Cooling)技術作為一種創新的散熱解決方案，正在成為數據中心綠色轉型的重要推動力。本文將從機房散熱的現有解決方案出發，深入探討浸沒式液冷技術的起源、適用場景、技術形式、特色、優缺點及其未來發展趨勢。

數據中心散熱方案

ZMAN試著將這個大題目簡單劃分成傳統和現代兩大類

傳統散熱 – 氣冷

CRAC和CRAH 兩種常見的機房空調型式，細節請見魔力門另一篇專文

冷熱通道將機櫃排好，不再前排機櫃後方熱氣跑去後排機櫃的前方，細節請見魔力門另一篇專文

封閉熱通道避免混風，煙囪機櫃為最常見代表

封閉冷通道避免混風，避免大型數據中心初期投資巨大

輔助空調為解決高密度熱區，主要空調外增加櫃頂或櫃側輔助空調，也有少見的機櫃後方水冷門

現代散熱 – 液冷

Direct Liquid Cooling – DLC 直接液冷

依照冷板直接接觸的位置可以分成

用冷板只對CPU GPU兩個關鍵元件
用冷板對整台伺服器大部分元件

冷板帶出伺服器的熱後，又可以分成兩種解熱方法

水對氣常見的是在機櫃後方安裝一個風扇門
水對水常見的是引到旁邊或附近的專門設備處理，AI數據中心現在幾乎都是這種

Immersion Cooling – 浸沒式液冷

型式上分成冷卻液不蒸發和會蒸發兩種，細節請看後續說明

單相浸沒式液冷
兩相浸沒式液冷

依照廠商因應既有機房或新建機房，又分兩種型式

為既有伺服器設計一個小箱子裝滿冷卻液，單台伺服器泡在這個小池子 (稀有少見)
設計一個大型像釣蝦池的池子(TANK)，將多組專門伺服器泡在這個大池子

浸沒式液冷的起源與發展

浸沒式液冷技術並非全新概念，其最早應用於高性能計算領域，後來逐漸擴展到數據中心、人工智慧和新能源等領域。近年來，隨著AI晶片（如NVIDIA B200）的功率突破1000W，傳統散熱技術已無法滿足需求，浸沒式液冷技術因此重新受到關注。

浸沒式液冷的技術形式

單相浸沒式液冷

工作原理

單相浸沒式液冷使用一種不發生相變的冷卻液（通常是礦物油或合成油），將伺服器完全浸泡在冷卻液中。冷卻液通過自然對流或泵驅動循環，將伺服器產生的熱量帶走，然後通過熱交換器將熱量排出到外部冷卻系統（如冷卻塔或冷水機）。

系統組成

冷卻液：通常是高熱容、低黏度的液體，如礦物油或合成油。
循環泵：用於驅動冷卻液流動，確保熱量被均勻帶走。
熱交換器：將冷卻液中的熱量傳遞到外部冷卻系統。
密封槽：用於容納伺服器和冷卻液，防止液體泄漏。

特點

冷卻液保持液態：冷卻液在整個循環過程中始終保持液態，不會發生相變。
系統簡單：相較於兩相系統，單相系統的設計和維護更簡單。
適用性廣：適合功率密度較高的場景，如數據中心和邊緣計算節點。

優點

穩定性高：冷卻液不發生相變，系統運行穩定。
維護方便：冷卻液不易揮發，更換和補充較為簡單。
成本較低：相較於兩相系統，單相系統的設備和冷卻液成本更低。

缺點

散熱效率有限：由於冷卻液不發生相變，散熱效率不如兩相系統高。
冷卻液體積大：需要較大量的冷卻液來維持散熱效果。

兩相浸沒式液冷

工作原理

兩相浸沒式液冷使用一種會發生相變的冷卻液（如氟化液），將伺服器完全浸泡在冷卻液中。當伺服器運行時，冷卻液吸收熱量並從液態轉變為氣態，氣態冷卻液上升到冷凝器，冷凝後重新變為液態，完成循環。

系統組成

冷卻液：通常是低沸點的氟化液，如3M的Novec系列。
冷凝器：用於將氣態冷卻液冷凝回液態。
密封槽：用於容納伺服器和冷卻液，防止氣體泄漏。

特點

冷卻液發生相變：冷卻液在吸收熱量後從液態變為氣態，散熱效率更高。
系統複雜：由於涉及相變，系統設計和維護較為複雜。
適用於超高功率密度：適合單CPU功率超過1000W的超高功率密度場景。

優點

散熱效率極高：相變過程能帶走大量熱量，散熱效率遠高於單相系統。
冷卻液用量少：由於冷卻液發生相變，所需冷卻液的體積較少。
節能效果顯著：PUE值可降至1.05以下，節能效果優於單相系統。

5. 缺點

成本高：冷卻液和設備成本較高，初期投資大。
維護複雜：冷卻液的揮發性和系統的複雜性增加了維護難度。
技術要求高：需要精密的冷凝器和密封設計，技術門檻較高。

單相與兩相浸沒式液冷的比較

特性	單相浸沒式液冷	兩相浸沒式液冷
冷卻液狀態	始終保持液態	液態變氣態，再冷凝回液態
散熱效率	較低	極高
系統複雜性	簡單	複雜
初期成本	較低	較高
維護難度	較低	較高
適用場景	高功率密度數據中心、邊緣計算	超高功率密度AI伺服器、HPC集群
PUE值	1.1-1.2	1.05以下

浸沒式液冷的特色與優點

高效散熱：

浸沒式液冷通過直接接觸散熱，能夠應對單CPU功率1000W以上、整機櫃功率30kW以上的散熱需求。

節能環保：

浸沒式液冷的PUE值可降至1.1以下，顯著降低數據中心的能耗和碳排放。

安全性高：

冷卻液通常具有阻燃性和化學穩定性，能夠有效降低火災風險，並確保業務的連續性。

空間利用率高：

浸沒式液冷技術支持高密度部署，能夠在有限的空間內容納更多伺服器。

浸沒式液冷的缺點與挑戰

初期投資高：

浸沒式液冷系統的設備和冷卻液成本較高，初期投資約為傳統風冷系統的3倍。

維護複雜：

當設備出現故障時，需要將伺服器從冷卻液中取出，可能導致冷卻液的泄漏和浪費。

技術成熟度：

浸沒式液冷技術的產業鏈尚未完全成熟，市場接受度仍需時間提升。

結論與未來展望

浸沒式液冷技術作為數據中心散熱的新革命，憑藉其高效散熱、節能環保和高安全性等優勢，正在成為未來數據中心的主流選擇。儘管面臨初期投資高和維護複雜等挑戰，但隨著技術的成熟和市場的推廣，浸沒式液冷技術將在AI、高性能計算和綠色數據中心等領域發揮更大的作用。未來，隨著冷卻液技術的進一步優化和成本的降低，浸沒式液冷技術有望在全球範圍內得到更廣泛的應用，為數據中心的綠色轉型和可持續發展提供強有力的支持。

概覽

數據中心散熱方案

傳統散熱 – 氣冷

現代散熱 – 液冷

Direct Liquid Cooling – DLC 直接液冷

Immersion Cooling – 浸沒式液冷

浸沒式液冷的起源與發展

浸沒式液冷的技術形式

單相浸沒式液冷

工作原理

系統組成

特點

優點

缺點

兩相浸沒式液冷

工作原理

系統組成

特點

優點

5. 缺點

單相與兩相浸沒式液冷的比較

浸沒式液冷的特色與優點

高效散熱：

節能環保：

安全性高：

空間利用率高：

浸沒式液冷的缺點與挑戰

初期投資高：

維護複雜：

技術成熟度：

結論與未來展望

相關文章: