Immersion Cooling – 浸沒式液冷是數據中心散熱的終極解決方案

本文最後更新日期 : 2025-02-27 , 更新作者 : ZMAN

概覽

隨著人工智慧、高性能計算(HPC)和雲端運算的快速發展,數據中心的功率密度不斷攀升,傳統的風冷散熱技術已難以滿足現代數據中心的散熱需求。浸沒式液冷(Immersion Cooling)技術作為一種創新的散熱解決方案,正在成為數據中心綠色轉型的重要推動力。本文將從機房散熱的現有解決方案出發,深入探討浸沒式液冷技術的起源、適用場景、技術形式、特色、優缺點及其未來發展趨勢。

數據中心散熱方案

ZMAN試著將這個大題目簡單劃分成傳統和現代兩大類

傳統散熱 – 氣冷

CRAC和CRAH 兩種常見的機房空調型式,細節請見魔力門另一篇專文

冷熱通道 將機櫃排好,不再前排機櫃後方熱氣跑去後排機櫃的前方,細節請見魔力門另一篇專文

封閉熱通道 避免混風,煙囪機櫃為最常見代表

封閉冷通道 避免混風,避免大型數據中心初期投資巨大

輔助空調 為解決高密度熱區,主要空調外增加櫃頂或櫃側輔助空調,也有少見的機櫃後方水冷門

現代散熱 – 液冷

Direct Liquid Cooling – DLC 直接液冷

依照冷板直接接觸的位置可以分成

  • 用冷板只對CPU GPU兩個關鍵元件
  • 用冷板對整台伺服器大部分元件

冷板帶出伺服器的熱後,又可以分成兩種解熱方法

  • 水對氣 常見的是在機櫃後方安裝一個風扇門
  • 水對水 常見的是引到旁邊或附近的專門設備處理,AI數據中心現在幾乎都是這種
XAI
XAI

Immersion Cooling – 浸沒式液冷

型式上分成冷卻液不蒸發和會蒸發兩種,細節請看後續說明

  • 單相浸沒式液冷
  • 兩相浸沒式液冷

依照廠商因應既有機房或新建機房,又分兩種型式

  • 為既有伺服器設計一個小箱子裝滿冷卻液,單台伺服器泡在這個小池子 (稀有少見)
  • 設計一個大型像釣蝦池的池子(TANK),將多組專門伺服器泡在這個大池子

浸沒式液冷的起源與發展

浸沒式液冷技術並非全新概念,其最早應用於高性能計算領域,後來逐漸擴展到數據中心、人工智慧和新能源等領域。近年來,隨著AI晶片(如NVIDIA B200)的功率突破1000W,傳統散熱技術已無法滿足需求,浸沒式液冷技術因此重新受到關注。

浸沒式液冷的技術形式

單相浸沒式液冷


圖片來源:技嘉官網

工作原理

單相浸沒式液冷使用一種不發生相變的冷卻液(通常是礦物油或合成油),將伺服器完全浸泡在冷卻液中。冷卻液通過自然對流或泵驅動循環,將伺服器產生的熱量帶走,然後通過熱交換器將熱量排出到外部冷卻系統(如冷卻塔或冷水機)。

系統組成

  • 冷卻液:通常是高熱容、低黏度的液體,如礦物油或合成油。
  • 循環泵:用於驅動冷卻液流動,確保熱量被均勻帶走。
  • 熱交換器:將冷卻液中的熱量傳遞到外部冷卻系統。
  • 密封槽:用於容納伺服器和冷卻液,防止液體泄漏。

特點

  • 冷卻液保持液態:冷卻液在整個循環過程中始終保持液態,不會發生相變。
  • 系統簡單:相較於兩相系統,單相系統的設計和維護更簡單。
  • 適用性廣:適合功率密度較高的場景,如數據中心和邊緣計算節點。

優點

  • 穩定性高:冷卻液不發生相變,系統運行穩定。
  • 維護方便:冷卻液不易揮發,更換和補充較為簡單。
  • 成本較低:相較於兩相系統,單相系統的設備和冷卻液成本更低。

缺點

  • 散熱效率有限:由於冷卻液不發生相變,散熱效率不如兩相系統高。
  • 冷卻液體積大:需要較大量的冷卻液來維持散熱效果。

兩相浸沒式液冷

圖片來源:技嘉官網

工作原理

兩相浸沒式液冷使用一種會發生相變的冷卻液(如氟化液),將伺服器完全浸泡在冷卻液中。當伺服器運行時,冷卻液吸收熱量並從液態轉變為氣態,氣態冷卻液上升到冷凝器,冷凝後重新變為液態,完成循環。

系統組成

  • 冷卻液:通常是低沸點的氟化液,如3M的Novec系列。
  • 冷凝器:用於將氣態冷卻液冷凝回液態。
  • 密封槽:用於容納伺服器和冷卻液,防止氣體泄漏。

特點

  • 冷卻液發生相變:冷卻液在吸收熱量後從液態變為氣態,散熱效率更高。
  • 系統複雜:由於涉及相變,系統設計和維護較為複雜。
  • 適用於超高功率密度:適合單CPU功率超過1000W的超高功率密度場景。

優點

  • 散熱效率極高:相變過程能帶走大量熱量,散熱效率遠高於單相系統。
  • 冷卻液用量少:由於冷卻液發生相變,所需冷卻液的體積較少。
  • 節能效果顯著:PUE值可降至1.05以下,節能效果優於單相系統。

5. 缺點

  • 成本高:冷卻液和設備成本較高,初期投資大。
  • 維護複雜:冷卻液的揮發性和系統的複雜性增加了維護難度。
  • 技術要求高:需要精密的冷凝器和密封設計,技術門檻較高。

單相與兩相浸沒式液冷的比較

特性單相浸沒式液冷兩相浸沒式液冷
冷卻液狀態始終保持液態液態變氣態,再冷凝回液態
散熱效率較低極高
系統複雜性簡單複雜
初期成本較低較高
維護難度較低較高
適用場景高功率密度數據中心、邊緣計算超高功率密度AI伺服器、HPC集群
PUE值1.1-1.21.05以下

浸沒式液冷的特色與優點

高效散熱

浸沒式液冷通過直接接觸散熱,能夠應對單CPU功率1000W以上、整機櫃功率30kW以上的散熱需求。

節能環保

浸沒式液冷的PUE值可降至1.1以下,顯著降低數據中心的能耗和碳排放。

安全性高

冷卻液通常具有阻燃性和化學穩定性,能夠有效降低火災風險,並確保業務的連續性。

空間利用率高

浸沒式液冷技術支持高密度部署,能夠在有限的空間內容納更多伺服器。

浸沒式液冷的缺點與挑戰

初期投資高

浸沒式液冷系統的設備和冷卻液成本較高,初期投資約為傳統風冷系統的3倍。

維護複雜

當設備出現故障時,需要將伺服器從冷卻液中取出,可能導致冷卻液的泄漏和浪費。

技術成熟度

浸沒式液冷技術的產業鏈尚未完全成熟,市場接受度仍需時間提升。

結論與未來展望

浸沒式液冷技術作為數據中心散熱的新革命,憑藉其高效散熱、節能環保和高安全性等優勢,正在成為未來數據中心的主流選擇。儘管面臨初期投資高和維護複雜等挑戰,但隨著技術的成熟和市場的推廣,浸沒式液冷技術將在AI、高性能計算和綠色數據中心等領域發揮更大的作用。未來,隨著冷卻液技術的進一步優化和成本的降低,浸沒式液冷技術有望在全球範圍內得到更廣泛的應用,為數據中心的綠色轉型和可持續發展提供強有力的支持。