Skip to Main Content

掌握 Ansys Rocky 軟體中的多重 GPU 並提升其效能

八月 13, 2024

2:00 Mins

READ ALOUD

Sergio Villalva | Ansys 資深研發驗證工程師
rocky-multi-gpu-blog-hero

粒狀材料在許多產業比比皆是,包括汽車、醫療照護、高科技與礦業。從製程與設備效能的角度來看,為這些大量材料進行動態建模,多年來始終是一項挑戰。

早期的離散元素分析法 (DEM) 模擬,僅限於處理小規模的問題,例如只有數千個近似球形的大型粒子。直到近年來,數值方法與硬體技術才發展到足以提供真正工程決策價值的傳真度。DEM 方法的創新演算法與圖形處理器 (GPU) 所提供的運算能力,為模擬開啟了全新視野。

DEM 程式碼與運算能力持續獲得改進,讓粒子模擬更貼近現實。現在的使用者可望利用實際粒子形狀與真實粒徑分佈 (PSD) 以模擬問題,並建構含有數百萬個粒子的 DEM 模擬。

然而,模擬準確度有所提升,同樣在處理時間與記憶體需求方面增加運算負載。

有了 Ansys Rocky 粒子動力學模擬軟體,可使用 GPU 抵銷這些負載,並在實際可行的期限內取得結果。

GPU 優勢與運作方式

導入 GPU 已使 DEM 成為實用的工程設計工具。該工具讓 GPU 加速程式碼 (Rocky 軟體即是一例),得以徹底發揮 DEM 的能力,以利處理 DEM 模擬模型中出現的數千萬個粒子。如今透過多重 GPU 平行處理功能,可大幅擴展應用範圍,並將 DEM 模擬用於分析含有上億個粒子的問題。

此外,在推動多重物理量模擬的今日世界,Rocky 軟體搭載 GPU 與多重 GPU 處理能力,可讓您將所有 CPU 資源投入耦合模擬,避免競爭硬體資源。

GPU 賦予 DEM 模擬大幅提升處理效能的潛力,Ansys 正是以 Rocky 軟體原生的多重 GPU 求解器技術,成為這場革新的先驅。

大規模的 DEM 模擬若涵蓋數百萬個粒子,將耗用大量硬體記憶體。此外,CPU 記憶體成本高昂,且模擬效能可能差異極大。單一 CPU 或 GPU 的記憶體容量有限,可處理的粒子數仍受此限制。

然而,Rocky 軟體搭載的多重 GPU 求解器,在單一主機板上高效分配與管理兩個以上 GPU 的總記憶體資源,進而突破這項限制。例如,運用多重 GPU 求解器技術的旋風分離器,成功模擬 2 億個粒子。這類極高粒子數的模擬在過去幾乎無法實現,如今則因 Rocky 軟體搭載的多重 GPU 功能而成真。

cyclone-separator

2 億個粒子的旋風模擬

旋轉式研磨機效能基準案例

為了更清楚說明在常見應用中所能獲得的處理速度提升,以及 Rocky 軟體求解器在高階 GPU 運轉的可擴展性,這裡提出旋轉式研磨機的效能基準案例。此案例包含一個部分填充粒子的滾筒,並以固定速度旋轉。從模擬一開始,所有粒子便已放入滾筒且維持在穩定狀態。

基準案例參數:

  • 滾筒旋轉速度:每秒旋轉 1 次
  • 模擬時間:0.01 秒
  • 粒子計數:1,600 萬與 3,200 萬
  • 粒子類型:多面體 (16 個三角形)
rotary-mill-case

旋轉式研磨機效能基準案例

基準案例選用的粒子類型是由 16 個三角形構成的多面體,能妥善呈現實際粒子的形狀條件。

為了在兩件案例中維持相同的配位數,此處假設粒子數/長度及接觸點/粒子數的比例相同,因此在粒子數增加時,研磨機沿旋轉軸方向的長度隨之增加。

GPU 配置:

  • 1 個 NVIDIA H100 Tensor Core GPU (總記憶體 94GB)
  • 2 個 NVIDIA H100 Tensor Core GPU (總記憶體 188GB,NVLink)
  • 4 個 NVIDIA H100 Tensor Core GPU (總記憶體 320GB,NVLink)
  • 8 個 NVIDIA H100 Tensor Core GPU (總記憶體 640GB,NVLink)
polyhedron

由 16 個三角形構成的多面體粒子

rotary-mill-geometry

3,200 萬個粒子的旋轉式研磨機幾何,其長度是 1,600 萬個粒子幾何的兩倍。

在兩件案例中,Rocky 軟體的求解器在多重 GPU 執行時,展現出優異的可擴展性,在 8 個 NVIDIA H100 Tensor Core GPU 上,對於 1,600 萬個粒子的模擬達到 6.7 倍的相對加速效果,對於 3,200 萬個粒子的模擬則達到 7.1 倍。

16m-particles-speedup

1,600 萬個粒子案例的相對加速效果

32m-particles-speedup

3,200 萬個粒子案例的相對加速效果

求解器執行 3,200 萬個粒子案例所用的 GPU 記憶體總量低於 90GB,意味著 Rocky 軟體能處理逾 2 億個真實形狀粒子的類似案例。

16m-particles-memory

1,600 萬個粒子案例的 GPU 記憶體總使用量

32m-particles-memory

3,200 萬個粒子案例的 GPU 記憶體總使用量

透過 Rocky 軟體的多重 GPU 求解器最佳化模擬結果

多重 GPU 處理能力是推動工程領域進入新一代物理模擬的重大助力。

根據本部落格所呈現的旋轉式研磨機測試結果,可見 Rocky 軟體與 NVIDIA H100 GPU 相容,並具有極為優異的表現。此外,該軟體因為記憶體使用量低,能處理逾 2 億個真實形狀粒子的龐大模擬案例。

Rocky 軟體的多重 GPU 求解器透過整合運算資源,能突破記憶體限制且大幅提升效能。該軟體可以加快您的粒子模擬速度,並加速涉及數百萬個粒子的大規模模擬。

如需在投資新硬體前獲得相關建議與指引,請參閱我們的 GPU 購買指南常見問答

如需進一步瞭解 Rocky 軟體,請與我們聯絡


專為您量身打造。我們還有一些您可能會喜歡的資源。

請您一探究竟


sergio-villalva
資深研發驗證工程師

Sergio Villalva 於 2022 年加入 Ansys。他目前擔任資深研發驗證工程師,隸屬於離散元素分析法 (DEM) 軟體的品質團隊。他專精於軟體測試、驗證與確認。他在機械零件開發領域擁有 12 年經驗:其中 6 年從事金屬與塑膠引擎零件開發;5 年運用電腦輔助工程工具,設計與最佳化柴油引擎連桿與曲軸;另有 1 年經驗運用有限元素分析、DEM 與最佳化工具,進行農業機具開發。Sergio 擁有機械工程碩士學位。



建議

Unleash the Power of Multibody Dynamics Simulations With Ansys Rocky Software

Unleash the Power of Multibody Dynamics Simulations With Ansys Rocky Software

Learn how coupling Ansys Rocky particle dynamics simulation software with Ansys Motion MBD simulation software offers solutions to complex engineering problems.

Ansys 透過 NVIDIA 工業 AI 雲端,進入歐洲快速通道

Ansys 透過 NVIDIA 工業 AI 雲端,進入歐洲快速通道

瞭解 Ansys 與 NVIDIA GPU 如何將工程見解提升至全新境界。

肯亞新創公司運用自然與模擬技術推進碳捕捉技術

肯亞新創公司運用自然與模擬技術推進碳捕捉技術

為了強化 Octavia Carbon 的直接空氣捕捉 (DAC) 技術,瞭解這家新創公司為何尋求 Ansys 提供強大的多物理模擬解決方案。

Advantage 部落格

Ansys Advantage 部落格文章具備來自 Ansys 和其他技術專家的見解,讓您隨時掌握 Ansys 模擬如何為推動人類進步的創新注入動能。