颗粒广泛应用于众多行业,包括汽车、医疗、高科技和采矿等行业。多年来,从工艺角度和设备性能角度来看,对这些散装物料的动力学分析一直都是一项挑战。
多年前,离散单元法(DEM)仿真仅能应用于小规模问题,例如,仅能处理几千个大型颗粒,且这些颗粒大多呈球形。直到最近,数值方法和硬件技术才达到了能够为工程决策提供实际价值的精度水平。DEM方法的创新算法和图形处理单元(GPU)的计算能力,为相关研究开辟了新的视野。
DEM代码和计算能力的持续改进,则实现了更接近现实的颗粒仿真。如今,用户可以使用真实颗粒形状和实际颗粒粒径分布(PSD)对问题进行仿真,从而创建包含数百万颗粒的DEM仿真。
然而,这些仿真精度的提升是以计算负荷增加为代价的,具体表现为处理时间和内存需求的大幅增加。
借助Ansys Rocky颗粒动力学仿真软件,可以通过使用GPU来应对大规模的颗粒动力学项目,使得GP具有工程实用价值。
GPU的加入,使得DEM真正成为了工程设计中实用的工具。借助GPU加速的软件代码(如Rocky软件中的代码),能够充分利用DEM的全部能力,在DEM仿真模型中处理数千万颗粒。借助多GPU并行处理功能,现在可以大幅扩展应用范围,并将DEM仿真用于分析包含数亿颗粒的问题。
此外,在我们进一步推动多物理场仿真发展的时代,Rocky软件GPU和多GPU处理能力,使您能够释放所有CPU资源以用于耦合仿真,从而避免硬件资源之间的竞争。
GPU有望显著提高DEM仿真的吞吐量,而Ansys凭借Rocky软件中原生实现的多GPU求解器,正处于这场变革的最前沿。
具有数百万颗粒的大规模DEM仿真会占用大量硬件内存。此外,CPU内存成本高昂,且仿真性能可能存在巨大差异。单个CPU或GPU的内存量有限,因此可处理的颗粒数量仍受此容量限制。
然而,Rocky软件中的多GPU求解器通过高效分配和管理单个主板上两个或多个GPU的组合内存,突破了这一限制。例如,采用多GPU求解器技术的旋风分离器能够仿真2亿个颗粒。以前,这种巨大数量级的颗粒仿真是无法实现的,但现在凭借Rocky软件中提供的多GPU功能,这已成为现实。
包含2亿颗粒的旋风仿真
为了更好地展示常见应用中可能实现的处理速度提升,以及Rocky软件求解器在高端GPU上运行时的可扩展性,我们制作了一个旋转磨机的性能基准测试案例。该案例涉及到一个部分填充有颗粒的滚筒,该滚筒以恒定速度旋转。从仿真开始,所有颗粒就已经处于滚筒内部,并保持稳定状态。
基准测试案例参数:
旋转磨机性能基准测试案例
为基准测试选择的颗粒类型是一个由16个三角形组成的多面体,它很好地代表了真实形状条件。
为了使两个案例具有性,使用相同的颗粒/长度比和接触/颗粒比,因此随着颗粒数量的增加,磨机长度在旋转轴方向上也相应增加。
GPU的配置:
由16个三角形组成的多面体颗粒
用于3200万颗粒仿真的旋转磨机几何尺寸,长度是用于1600万颗粒仿真的旋转磨机的两倍。
在两个案例中,Rocky软件求解器在多GPU运行中都表现出了出色的可扩展性,在八个NVIDIA H100 Tensor Core GPU上,1600万颗粒和3200万个颗粒的案例分别实现了6.7倍和7.1倍的相对加速。
1600万颗粒案例的相对加速
3200万颗粒案例的相对加速
求解器在运行3200万颗粒案例时所使用的GPU总内存少于90GB,这意味着Rocky软件可以处理超过2亿个真实形状颗粒的类似案例。
1600万颗粒案例所使用的GPU总内存
3200万颗粒案例所使用的GPU总内存
多GPU处理能力是工程物理仿真迈向更高水平的重要推动力。
根据本博客中的旋转磨机测试结果,我们发现Rocky软件与NVIDIA H100 GPU兼容,并且性能极佳。此外,由于内存消耗较低,该软件还可以处理包含超过2亿真实形状颗粒的大型案例。
通过聚合计算能力,Rocky软件中的多GPU求解器突破了内存限制,并实现了显著的性能提升。该软件可以加速颗粒仿真,并支持涉及数百万颗粒的大规模仿真。
在投资新硬件之前,请查看我们的GPU购买指南常见问题解答,以获取指南和建议。
Ansys Advantage博客(The Advantage Blog)由Ansys专家和其他技术专家撰写,让您随时了解Ansys如何为创新赋能,推动人类踏上伟大征程。