在本部落格系列的第一部分與第二部分中,我們探討了使用 Ansys Fluent GPU 求解器時,在多種使用案例上的加速效果,包括汽車外部空氣動力學、典型層流、共軛熱傳遞等。
在第三部分中,我們將展示 2024 年可用的最新應用案例,涵蓋不同的 GPU 硬體選項與模型複雜度,包括說明在計算流體力學 (CFD) 模擬中使用 GPU 所能帶來的大幅加速與能源節省。
請前往 Ansys 客戶入口網站下載最新版本的 Ansys Fluent GPU 求解器。
自 2023 年推出 Fluent GPU 求解器以來,我們在每次軟體版本更新中持續引入新功能。在 2024 年,我們引入了以下功能:
這些新功能將開啟全新的應用場景,讓使用者能夠以指數級加速與更低的能耗成本,進行先進燃燒、外部空氣動力學等模擬,並保持與傳統 Fluent 求解器相同的精確度。
隨選觀看「2024 R2 新功能:Ansys Fluent GPU 求解器」網路研討會,瞭解更多最新軟體更新內容。
透過 GPU 硬體,工程師現在可以在更大的網格數與指數級加速下,運行更複雜的模擬。在圖 1 的使用案例中,我們運行了一個 3.5 級全輪 360 度壓縮機,網格規模約為 5 億個單元。該案例使用 12 顆 NVIDIA A100 Tensor Core GPU 運行,並使用 2024 R1 版本提供的新滑動網格功能,搭配增強的大型渦流模擬 (LES) 數值方法。
圖 1.使用 Ansys Fluent GPU 求解器模擬全輪 360 度壓縮機
以往執行全輪壓縮機模擬是一項「英雄級」計算,可能一年只會考慮執行幾次,並需要數週甚至數月的求解時間。如今,透過 GPU 硬體的平行運算效能與 Fluent GPU 求解器的最新功能,您可以在一天工作時間內取得模擬結果。
在此案例中,我們使用了一個已廣為人知超過十年的簡易起落架 (RLG) 模型,該模型首次於 2010 年 6 月的首屆和第二屆機體噪音計算基準問題研討會 (BANC-I 與 BANC-II) 中提出。此使用案例具有重要意義,因為流經支柱與輪子的紊流流動會產生阻力與噪音。儘管幾何相對簡單,但紊流流動具有明顯的分離現象與尾流結構,這兩者在模擬中都非常難以準確捕捉。
圖 2.迎風紊流流動模擬
圖 3.背風紊流流動模擬
該模擬的總網格數為 1,440 萬個多面體單元,運行為瞬態模擬,並使用完全尺度解析的大型渦流模擬 (LES)。該模擬在 Fluent GPU 求解器上使用四顆 NVIDIA L40 GPU 運行,相較於使用 120 顆 Intel® Xeon® Gold CPU 核心的 CPU 配置,求解速度快了 10.5 倍。
圖 4.四顆 NVIDIA L40 GPU 執行相同研究時,比 CPU 硬體配置快 10.5 倍。
我們在此使用案例中也觀察到與實驗資料的高度吻合。平均壓力係數是計算於兩個輪胎的中線位置。我們可以看到 GPU 結果與實驗資料高度吻合。
圖 5.GPU 結果在前輪 (左) 與後輪 (右) 上皆與實驗資料極為接近。
氣動聲學模擬可能非常複雜且昂貴,因為可能存在多個噪音來源,而這些來源是由具有多層次交互作用的機制所觸發。由於聲音噪音產生與傳播具有不穩定的特性,這類模擬在傳統平行 CPU 硬體上可能需要數天甚至數週才能完成。然而,利用 Fluent 軟體內建的 GPU 求解器,可以將所需時間縮短至原本的十分之一甚至更少,具體取決於所使用的 GPU 類型與數量。
在圖 6 與圖 7 所示的研究中,我們使用 Fluent GPU 求解器,並採用廣為人知的 Ffowcs Williams-Hawkings (FW-H) 模型,進行了一個低壓軸流風扇的氣動聲學模擬。該案例的總網格數為 2,420 萬,並在八顆 NVIDIA L40 GPU 上運行,耗時約 11 小時 (每一次風扇轉子旋轉約需 1.5 小時,共需七到八次旋轉)。
圖 6 顯示了因紊流分離而從轉子產生的渦流結構。這些紊流加上來自移動葉片的壓力波動,導致了風扇特有的音調與寬頻噪音特徵。我們同樣觀察到與實驗資料高度一致的結果,如圖 7 所示。
圖 6.低壓軸流風扇的氣動聲學模擬
圖 7.此圖顯示了計算流體力學 (CFD) 結果與實驗資料的高度吻合。
在一個具有 120 核心的基準 CPU 系統上運行相同的模擬,通常需要數天才能完成。利用 GPU 來進行這些研究,能夠提升設計空間探索能力,進而實現更高的最佳化與效率。
在 CFD 研究中,加速效能的提升確實很有價值,但如果結果不準確,或與實驗資料不符,其價值就大打折扣。Fluent 軟體以其精確的求解器與物理模型聞名,自 2022 年推出 Fluent GPU 求解器以來,我們已進行了廣泛的精度驗證研究。這些驗證研究顯示 GPU 結果與實驗資料高度吻合。
若要取得更多驗證基準,請閱讀我們的 2024 R2 驗證研究白皮書。
GPU 加速效能的價值非常明確,因為它對設計週期的迭代與長度有正面影響,進而加快產品上市時間。但是 GPU 的電力與能源成本又如何呢?Ansys 已經進行研究,以瞭解 GPU 與 CPU 配置在耗電與硬體成本上的差異。
在圖 8 所示的比較中,我們針對 DrivAer 模型進行了一個 2.5 億網格的外部空氣動力學研究,分別在 CPU 與 GPU 配置下運行 LES 模型並進行 50,000 個時間步模擬。根據我們的分析,使用 GPU 運行此模型的硬體成本效益比使用 CPU 高出 9 倍,能源效率則高出 33 倍。
圖 8.四顆 NVIDIA A100 GPU 在硬體成本效益上,比 CPU 硬體配置高出 9 倍。
圖 9.四顆 NVIDIA A100 GPU 在能源效率上,比 CPU 硬體配置高出 33 倍。
GPU 在電力、能源與時間上的節省非常可觀,效益十分明顯。我們同時支援 NVIDIA 與 AMD GPU,協助使用者更廣泛地使用加速運算。雲端型高效能運算 (HPC) 解決方案同樣是絕佳的選擇。Ansys 目前針對雲端與 HPC 技術提供以下解決方案:
我們也與以下廠商合作:
隨著通用 GPU 運算的發展,我們正在見證 CFD 的重大轉變,而 Ansys 正引領這一趨勢。隨著 GPU 越來越普及,並有更多企業開始採用 GPU 以加快工作流程、降低成本,及早投資、保持領先顯得格外重要。與 Ansys 合作,您可以信賴我們的軟體,其速度與準確度經過嚴格且持續的基準測試,並由專注於提供最佳 CFD 軟體解決方案的研發團隊全力支持。
Ansys 也是第一個採用 NVIDIA Omniverse Blueprint 進行即時電腦輔助工程數位孿生的公司,該流程整合了 NVIDIA 加速函式庫、人工智慧框架與 Omniverse 技術,能在 Ansys 應用程式中實現即時、互動的物理可視化。這將幫助使用者實現 1,200 倍加速的模擬與即時可視化。
第一次接觸 Fluent GPU 求解器嗎?可以先從 Ansys Innovation Space 上的免費學習課程開始。
前往 Ansys Help 網站的 Fluent GPU 求解器文件頁面。
還有其他問題嗎?請參閱 Fluent GPU 求解器常見問題頁面。