Skip to Main Content

      

ANSYS BLOG

May 11, 2022

在 Ansys Fluent 中釋放 GPU 的無限潛力 Part 1

您下班回家的路程、從紐約飛往倫敦的航班、辦公室內慢到不行的舊咖啡機……這些就像流體 (CFD) 模擬一樣, 只要縮短花費在完成這些事的時間,就可以為我們的生活帶來更多好處跟便利!

多年來,加速 CFD 模擬的關鍵推動力之一就是高性能計算 (HPC),而近年來已擴展到圖形處理器 (GPU)。

在 CFD 世界中,運用 GPU 並不是一個新的概念。 GPU 被用作 CFD 加速器已經有一段時間了(包括自 2014 年以來在 Ansys Fluent 中)。 雖然GPU運算能在不同問題中獲得局部加速。但整體速度的提升不只取決於單個GPU中的計算效率,若未針對多個GPU間的資訊傳遞進行優化,最終仍會限制整體的加速效果。 這就是為什麼我們想向您展示,為在多個GPU中執行CFD運算的巨大潛力。

這是此部落格系列文章中,「透過 Ansys Fluent,釋放  GPU 的無限潛力 」一文中,我們將向您展示 GPU 如何幫助減少模擬時間、硬體成本與功耗。 在此部分中,我們將介紹一些層流和紊流問題。 我們也會持續在此系列中新增更多文章,帶您探論更多、更廣的物理建模能力。

將汽車外部空氣動力學的模擬速度提升32倍

第一個範例,就讓我們一起來看一下汽車外部空氣動力學模擬,它可以在短的時間內變得非常龐大——通常超過 3 億個網格。 要跑這種規模的模擬需要數千個核心和數天(有時甚至數週)的計算時間。 如果有一種方法可以將模擬時間,從幾週縮短到幾天或幾天縮短到幾小時,同時還能顯著降低功耗呢? 大會報告:真的有!那就是可完整在 GPU 上運作的模擬軟體。

永續發展是汽車產業很重要的議題,全球的政府機構都在製定嚴格的規定。 有些汽車公司已開始評估他們是否符合這些規定,其評估的領域包括:

  • 改善空氣動力學
  • 減少排放
  • 使用替代燃料
  • 開發混合動力和電動動力系統

但永續發展的成果不應僅限於最終產品(在本例中為汽車)的製造,這種為環境做出的改變,也應延伸到產品的設計過程— —包括模擬, 我們在Ansys 就是致力於減少模擬過程中的功耗。

在 GPU 上完整運行可以加速汽車外部空氣動力學模擬

在 GPU 上完整運行可以加速汽車外部空氣動力學模擬

在所顯示的模擬圖中,我們使用 Fluent 在不同的 CPU 和 GPU 配置上運行基準測試 DrivAer 模型並進行性能的比較。 結果顯示,單個 NVIDIA A100 GPU 的性能比一個叢集的 80 Intel® Xeon® Platinum 8380 Cores 的性能高 5 倍以上。 當增加到 8 個 NVIDIA A100 GPU 時,模擬速度可以提高 30 倍以上。

利用 GPU 加速汽車外部空氣動力學模擬

利用 GPU 加速汽車外部空氣動力學模擬

我們都希望在更短的時間內獲得成效,為我們的客戶節省時間,但我們可以做到的事不止於此:我們還可以透過大幅降低運行此類模擬所需的電力,為我們的客戶減少他們的電費 ( 同時拯救我們的地球!)。

我們觀察了1024  Intel® Xeon® Gold 6242 核心的 CPU 叢集的功耗,其功耗為 9600 W。在提供相同的性能前提下, 6 x NVIDIA® V100 GPU 伺服器在功耗方面降低了四倍,只需使用 2400 W。

這些基準測試結果表明,與同等性能的 HPC 叢集相比,選擇 6 x NVIDIA® V100 GPU 伺服器的公司可以將功耗降低 4 倍,這甚至還未考慮為保持伺服器機房涼爽,所節省下來的冷卻成本。

使用 GPU 伺服器時的功耗降低

使用 GPU 伺服器時的功耗降低

在原生 GPU 求解器上運行模擬軟體,可以協助您的公司實現永續發展的願景以及巨幅減少等待模擬結果的時間— —而且這些都是您可以信任的結果。 在過去的 40 多年中,Fluent 已在各種應用中得到廣泛驗證,並以領先業界的準確性而聞名。 Fluent 中可用的 CPU 和多 GPU 求解器,都建立在相同的離散化和數值方法上,為使用者提供相同精準的結果。

下面的兩個典型案例是已完整建立的的 CFD 驗證,它們模擬了層流和紊流狀態的基本原理。 這兩種情況都詳細說明了使用者在原生 GPU 上求解時將獲得的準確度。

球體上的層流

文獻資料中充斥著關於球體流動的實驗和數值研究,這些皆可作為外部空氣動力學驗證的基準。 在第一個測試中,我們選擇了雷諾數等於 100 的層流條件,並且預計流體會繞過球體、在圓柱體後面形成恆時的渦流結構。 我們將文獻資料中所提出的阻力相關數據,與 CFD 的實驗結果數據進行對比。

球基準測試上層流的速度流線和壓力分佈

球基準測試上層流的速度流線和壓力分佈

As shown in Table 1, the native GPU implementation computes the drag coefficient very accurately, with an error percentage of only -0.252%.

阻力係數 (Cd) 比較

表 1. 阻力係數 (Cd) 比較

背向階梯流場

背向階梯流場是用於測試紊流模型實作的典型問題。 看似簡單的配置,其中卻蘊含著豐富的物理特性。 在這個測試中,我們重新創建了 Vogel 和 Eaton 的實驗裝置,入口速度為每秒 2.3176 公尺。 透過沿著通道長度的不同平面的速度曲線與已發布的實驗數據進行比較,對 CFD 程式碼進行了測試。

背向階梯流場流動的速度向量

背向階梯流場流動的速度向量

當在 CPU 上求解時,Fluent 顯示出良好驗證的實驗結果3,4。 使用者若使用原生多 GPU 求解器,解決同樣的問題,獲得的結果幾乎相同。如下所示,因為 Fluent 中可用的 CPU 和 GPU 求解器都是基於相同的離散化和數值方法所構建的。

在 CPU 和 GPU 上求解背向階梯流場的速度曲線結果

在 CPU 和 GPU 上求解背向階梯流場的速度曲線結果

這種接受所有非結構網格類型的有限體積 Navier-Stokes 求解器的原生多 GPU 執行程序,真正做到了創新,並為 CFD 訂定了新的標準,而且不影響準確性。 想了解 GPU 強大潛能將如何解決您的問題,並加速您的運行速度嗎? 立即聯繫我們


References 文獻參考

  1. Turton, R.; and Levenspiel, O., A short note on the drag correlation for spheres, Powder Technol., 47, 83-86, 1986
  2. Vogel J.C., and Eaton, J. K. (1985) Combined heat transfer and fluid dynamic measurements downstream of a backwards-facing step. J. Heat Transfer 107, 922-929.
  3. Smirnov, Evgueni & Smirnovsky, Alexander & Shchur, Nikolai & Zaitsev, Dmitri & Smirnov, P. (2018). Comparison of RANS and IDDES solutions for turbulent flow and heat transfer past a backward-facing step. Heat and Mass Transfer. 54. 10.1007/s00231-017-2207-0
  4. Banait H., Bais A., Khondekar K., Choudhary R., Bhambere M.B. (2020). Numerical Simulation of Fluid Flow over a Modified Backward Facing Step using CFD. International Research Journal of Engineering and Technology. Volume 7, Issue 9

查看 Ansys 的服務與產品

立即聯絡我們

* = 必填欄位

感謝您聯絡我們!

我們將在此解答您的問題,並期待與您交流互動。Ansys 的銷售團隊成員會立即與您聯絡。

Footer Image