Skip to Main Content

Ansys Rocky软件支持多GPU并提高仿真效率

八月 13, 2024

READ ALOUD

PAUSE READ

Sergio Villalva | Ansys高级研发验证工程师
rocky-multi-gpu-blog-hero

颗粒广泛应用于众多行业,包括汽车、医疗、高科技和采矿等行业。多年来,从工艺角度和设备性能角度来看,对这些散装物料的动力学分析一直都是一项挑战。

多年前,离散单元法(DEM)仿真仅能应用于小规模问题,例如,仅能处理几千个大型颗粒,且这些颗粒大多呈球形。直到最近,数值方法和硬件技术才达到了能够为工程决策提供实际价值的精度水平。DEM方法的创新算法和图形处理单元(GPU)的计算能力,为相关研究开辟了新的视野。

DEM代码和计算能力的持续改进,则实现了更接近现实的颗粒仿真。如今,用户可以使用真实颗粒形状和实际颗粒粒径分布(PSD)对问题进行仿真,从而创建包含数百万颗粒的DEM仿真。

然而,这些仿真精度的提升是以计算负荷增加为代价的,具体表现为处理时间和内存需求的大幅增加。

借助Ansys Rocky颗粒动力学仿真软件,可以通过使用GPU来应对大规模的颗粒动力学项目,使得GP具有工程实用价值。

GPU的优势及其工作原理

GPU的加入,使得DEM真正成为了工程设计中实用的工具。借助GPU加速的软件代码(如Rocky软件中的代码),能够充分利用DEM的全部能力,在DEM仿真模型中处理数千万颗粒。借助多GPU并行处理功能,现在可以大幅扩展应用范围,并将DEM仿真用于分析包含数亿颗粒的问题。

此外,在我们进一步推动多物理场仿真发展的时代,Rocky软件GPU和多GPU处理能力,使您能够释放所有CPU资源以用于耦合仿真,从而避免硬件资源之间的竞争。

GPU有望显著提高DEM仿真的吞吐量,而Ansys凭借Rocky软件中原生实现的多GPU求解器,正处于这场变革的最前沿。

具有数百万颗粒的大规模DEM仿真会占用大量硬件内存。此外,CPU内存成本高昂,且仿真性能可能存在巨大差异。单个CPU或GPU的内存量有限,因此可处理的颗粒数量仍受此容量限制。

然而,Rocky软件中的多GPU求解器通过高效分配和管理单个主板上两个或多个GPU的组合内存,突破了这一限制。例如,采用多GPU求解器技术的旋风分离器能够仿真2亿个颗粒。以前,这种巨大数量级的颗粒仿真是无法实现的,但现在凭借Rocky软件中提供的多GPU功能,这已成为现实。

cyclone-separator

包含2亿颗粒的旋风仿真

旋转磨机性能基准测试案例

为了更好地展示常见应用中可能实现的处理速度提升,以及Rocky软件求解器在高端GPU上运行时的可扩展性,我们制作了一个旋转磨机的性能基准测试案例。该案例涉及到一个部分填充有颗粒的滚筒,该滚筒以恒定速度旋转。从仿真开始,所有颗粒就已经处于滚筒内部,并保持稳定状态。

基准测试案例参数:

  • 滚筒转速:每秒1圈
  • 仿真时间:0.01秒
  • 颗粒数量:1600万和3200万
  • 颗粒类型:多面体(由16个三角形组成)
rotary-mill-case

旋转磨机性能基准测试案例

为基准测试选择的颗粒类型是一个由16个三角形组成的多面体,它很好地代表了真实形状条件。

为了使两个案例具有性,使用相同的颗粒/长度比和接触/颗粒比,因此随着颗粒数量的增加,磨机长度在旋转轴方向上也相应增加。

GPU的配置:

  • 一个NVIDIA H100 Tensor Core GPU(总内存94GB)
  • 两个NVIDIA H100 Tensor Core GPU(总内存188GB,NVLink)
  • 四个NVIDIA H100 Tensor Core GPU(总内存320GB,NVLink)
  • 八个NVIDIA H100 Tensor Core GPU(总内存640GB,NVLink)
polyhedron

由16个三角形组成的多面体颗粒

rotary-mill-geometry

用于3200万颗粒仿真的旋转磨机几何尺寸,长度是用于1600万颗粒仿真的旋转磨机的两倍。

在两个案例中,Rocky软件求解器在多GPU运行中都表现出了出色的可扩展性,在八个NVIDIA H100 Tensor Core GPU上,1600万颗粒和3200万个颗粒的案例分别实现了6.7倍和7.1倍的相对加速。

16m-particles-speedup

1600万颗粒案例的相对加速

32m-particles-speedup

3200万颗粒案例的相对加速

求解器在运行3200万颗粒案例时所使用的GPU总内存少于90GB,这意味着Rocky软件可以处理超过2亿个真实形状颗粒的类似案例。

16m-particles-memory

1600万颗粒案例所使用的GPU总内存

32m-particles-memory

3200万颗粒案例所使用的GPU总内存

通过Rocky软件多GPU求解器优化结果

多GPU处理能力是工程物理仿真迈向更高水平的重要推动力。

根据本博客中的旋转磨机测试结果,我们发现Rocky软件与NVIDIA H100 GPU兼容,并且性能极佳。此外,由于内存消耗较低,该软件还可以处理包含超过2亿真实形状颗粒的大型案例。

通过聚合计算能力,Rocky软件中的多GPU求解器突破了内存限制,并实现了显著的性能提升。该软件可以加速颗粒仿真,并支持涉及数百万颗粒的大规模仿真。

在投资新硬件之前,请查看我们的GPU购买指南常见问题解答,以获取指南和建议。

如欲了解有关Rocky软件的更多信息,欢迎直接联系我们


为您量身定制。我们还有一些您可能喜欢的其他资源。

查阅


sergio-villalva
高级研发验证工程师

Sergio Villalva于2022年开始在Ansys工作。目前,他在离散单元法(DEM)软件质量团队担任高级研发验证工程师,专注于软件测试、验证和确认工作。他在机械组件开发方面拥有长达12年的丰富经验,其中包括六年的金属和塑料发动机组件开发经验,五年使用计算机辅助工程工具设计和优化柴油发动机连杆和曲轴的经验,以及一年使用有限元分析、DEM和优化工具开发农业机械的经验。Sergio拥有机械工程硕士学位。



推荐内容

Unleash the Power of Multibody Dynamics Simulations With Ansys Rocky Software

Unleash the Power of Multibody Dynamics Simulations With Ansys Rocky Software

Learn how coupling Ansys Rocky particle dynamics simulation software with Ansys Motion MBD simulation software offers solutions to complex engineering problems.

Ansys通过NVIDIA工业AI云加速进入欧洲市场

Ansys通过NVIDIA工业AI云加速进入欧洲市场

了解Ansys和NVIDIA GPU如何将工程洞察提升到新的高度。

肯尼亚初创公司利用自然资源与仿真推动碳捕获技术发展

肯尼亚初创公司利用自然资源与仿真推动碳捕获技术发展

了解初创公司Octavia Carbon为何选择Ansys强大的多物理场仿真解决方案,来增强直接空气捕获(DAC)技术。

Advantage博客

Ansys Advantage博客(The Advantage Blog)由Ansys专家和其他技术专家撰写,让您随时了解Ansys如何为创新赋能,推动人类踏上伟大征程。