產品系列
查看所有產品Ansys致力於為當今的學生打下成功的基礎,通過向學生提供免費的模擬工程軟體。
粒狀材料在許多產業比比皆是,包括汽車、醫療照護、高科技與礦業。從製程與設備效能的角度來看,為這些大量材料進行動態建模,多年來始終是一項挑戰。
早期的離散元素分析法 (DEM) 模擬,僅限於處理小規模的問題,例如只有數千個近似球形的大型粒子。直到近年來,數值方法與硬體技術才發展到足以提供真正工程決策價值的傳真度。DEM 方法的創新演算法與圖形處理器 (GPU) 所提供的運算能力,為模擬開啟了全新視野。
DEM 程式碼與運算能力持續獲得改進,讓粒子模擬更貼近現實。現在的使用者可望利用實際粒子形狀與真實粒徑分佈 (PSD) 以模擬問題,並建構含有數百萬個粒子的 DEM 模擬。
然而,模擬準確度有所提升,同樣在處理時間與記憶體需求方面增加運算負載。
有了 Ansys Rocky 粒子動力學模擬軟體,可使用 GPU 抵銷這些負載,並在實際可行的期限內取得結果。
導入 GPU 已使 DEM 成為實用的工程設計工具。該工具讓 GPU 加速程式碼 (Rocky 軟體即是一例),得以徹底發揮 DEM 的能力,以利處理 DEM 模擬模型中出現的數千萬個粒子。如今透過多重 GPU 平行處理功能,可大幅擴展應用範圍,並將 DEM 模擬用於分析含有上億個粒子的問題。
此外,在推動多重物理量模擬的今日世界,Rocky 軟體搭載 GPU 與多重 GPU 處理能力,可讓您將所有 CPU 資源投入耦合模擬,避免競爭硬體資源。
GPU 賦予 DEM 模擬大幅提升處理效能的潛力,Ansys 正是以 Rocky 軟體原生的多重 GPU 求解器技術,成為這場革新的先驅。
大規模的 DEM 模擬若涵蓋數百萬個粒子,將耗用大量硬體記憶體。此外,CPU 記憶體成本高昂,且模擬效能可能差異極大。單一 CPU 或 GPU 的記憶體容量有限,可處理的粒子數仍受此限制。
然而,Rocky 軟體搭載的多重 GPU 求解器,在單一主機板上高效分配與管理兩個以上 GPU 的總記憶體資源,進而突破這項限制。例如,運用多重 GPU 求解器技術的旋風分離器,成功模擬 2 億個粒子。這類極高粒子數的模擬在過去幾乎無法實現,如今則因 Rocky 軟體搭載的多重 GPU 功能而成真。
2 億個粒子的旋風模擬
為了更清楚說明在常見應用中所能獲得的處理速度提升,以及 Rocky 軟體求解器在高階 GPU 運轉的可擴展性,這裡提出旋轉式研磨機的效能基準案例。此案例包含一個部分填充粒子的滾筒,並以固定速度旋轉。從模擬一開始,所有粒子便已放入滾筒且維持在穩定狀態。
基準案例參數:
旋轉式研磨機效能基準案例
基準案例選用的粒子類型是由 16 個三角形構成的多面體,能妥善呈現實際粒子的形狀條件。
為了在兩件案例中維持相同的配位數,此處假設粒子數/長度及接觸點/粒子數的比例相同,因此在粒子數增加時,研磨機沿旋轉軸方向的長度隨之增加。
GPU 配置:
由 16 個三角形構成的多面體粒子
3,200 萬個粒子的旋轉式研磨機幾何,其長度是 1,600 萬個粒子幾何的兩倍。
在兩件案例中,Rocky 軟體的求解器在多重 GPU 執行時,展現出優異的可擴展性,在 8 個 NVIDIA H100 Tensor Core GPU 上,對於 1,600 萬個粒子的模擬達到 6.7 倍的相對加速效果,對於 3,200 萬個粒子的模擬則達到 7.1 倍。
1,600 萬個粒子案例的相對加速效果
3,200 萬個粒子案例的相對加速效果
求解器執行 3,200 萬個粒子案例所用的 GPU 記憶體總量低於 90GB,意味著 Rocky 軟體能處理逾 2 億個真實形狀粒子的類似案例。
1,600 萬個粒子案例的 GPU 記憶體總使用量
3,200 萬個粒子案例的 GPU 記憶體總使用量
多重 GPU 處理能力是推動工程領域進入新一代物理模擬的重大助力。
根據本部落格所呈現的旋轉式研磨機測試結果,可見 Rocky 軟體與 NVIDIA H100 GPU 相容,並具有極為優異的表現。此外,該軟體因為記憶體使用量低,能處理逾 2 億個真實形狀粒子的龐大模擬案例。
Rocky 軟體的多重 GPU 求解器透過整合運算資源,能突破記憶體限制且大幅提升效能。該軟體可以加快您的粒子模擬速度,並加速涉及數百萬個粒子的大規模模擬。
如需在投資新硬體前獲得相關建議與指引,請參閱我們的 GPU 購買指南常見問答。