在该博客系列的第一部分和第二部分中,我们探讨了Ansys Fluent求解器的加速功能在多个用例中的表现,其中包括汽车外部空气动力学、标准层流以及共轭传热等应用。
在第三部分中,我们将介绍2024年最新用例,这些案例涉及到不同的GPU硬件选项和模型复杂度,并展示通过GPU进行计算流体力学(CFD)仿真而获得的显著加速和节能优势。
在Ansys客户门户网站上下载最新版本的Ansys Fluent GPU求解器。
自Fluent GPU求解器于2023年发布以来,我们不断在每个软件版本中引入新功能。2024年,我们引入了以下功能:
这些新功能将拓展新的应用场景,帮助用户以指数级提升的求解速度、更低的功耗成本,执行高级燃烧以及空气动力学等计算任务,同时保持与传统Fluent求解器相同的精度。
观看“2024 R2新功能:Ansys Fluent GPU求解器”网络研讨会点播视频,了解有关最新软件更新的更多信息。
借助GPU硬件,工程师们现在能够运行复杂性显著增加、网格数量更庞大的仿真,且速度呈指数级提升。在图1的用例中,我们运行了一款3.5级全环压缩机的仿真,其包含约5亿个网格单元。该用例在12个NVIDIA A100 Tensor Core GPU上运行,使用了2024 R1版本中新提供的滑移网格功能,同时结合了增强大涡模拟(LES)数值方法。
图1:使用Ansys Fluent GPU求解器仿真全环压缩机
运行全环压缩机仿真,曾经是一项“超级”计算任务——一年您可能只会考虑运行几次,而且需要数周或数月的求解时间。现在,利用GPU硬件的并行性能和Fluent GPU求解器提供的最新功能,您可以在一个工作日的工时内获得结果。
在本用例中,我们使用了一个简化起落架(RLG)模型。该模型已被业界熟知十余年,其最早于2010年6月举行的第一届和第二届机体噪声计算基准问题研讨会(BANC-I和BANC-II)上提出。支柱和车轮上的湍流会产生阻力和噪声,因此该用例非常重要。尽管湍流的几何结构相对简单,但它具有显著的分离和不断演化的尾流结构,这两者都很难通过仿真彻底捕获。
图2:逆风湍流仿真
图3:顺风湍流仿真
该仿真的总网格量为1,440万个多面体网格,作为瞬态运行并采用尺度解析的大涡模拟仿真(LES)求解。该仿真在支持4个NVIDIA L40 GPU的Fluent GPU求解器上运行,与120个Intel® Xeon® Gold CPU内核的CPU配置相比,求解时间缩短了10.5倍。
图4:运行相同研究时,4个NVIDIA L40 GPU比CPU硬件配置快10.5倍。
此外,我们还发现,与该用例的实验数据非常一致。计算了两个轮胎中线位置的平均压力系数。我们发现,GPU结果与实验数据非常吻合。
图5:GPU结果与前轮胎(左)和后轮轮胎(右)的实验数据非常吻合。
气动声学仿真可能极其复杂且成本高昂,因为可能存在多个噪声源,而这些噪声源由具有多层相互作用机制的过程触发。由于声学噪声产生和传播的固有不稳定特性,在传统并行CPU计算硬件上运行这类仿真,可能需要数天或数周。不过,使用Fluent软件的原生GPU求解器,可将这些时间缩短最多达一个数量级或更多,具体取决于所用的GPU类型和数量。
在图6及图7所示的研究中,我们使用著名的Ffowcs Williams-Hawkings(FW-H)模型,在Fluent GPU求解器上对低压轴流风扇进行气动声学仿真。该算例的总网格数为2,420万,在8个NVIDIA L40 GPU上运行大约11小时(风扇转子每转约1.5小时,总共需要7到8转)。
图6是湍流分离导致转子产生的涡流结构。这种湍流以及移动叶片产生的压力波动,会产生独特的风扇音调和宽带噪声特征。我们还发现该结果与实验数据非常吻合,如图7所示。
图6:低压轴流风扇的气动声学仿真
图7:该图显示,计算流体力学(CFD)结果与实验数据非常吻合。
在120核的基准CPU系统上运行相同的仿真,通常需要数天才能完成。利用GPU来运行这些研究,将实现更强大的设计空间探索,从而可增强优化与效率。
CFD研究的提速具有明显的价值,但如果结果不准确或与实验数据吻合度不高,该价值就会大打折扣。Fluent软件以其精确的求解器和物理场模型而闻名,自2022年发布Fluent GPU求解器以来,我们已经执行了广泛的精度验证研究。这些验证研究表明,GPU结果与实验数据非常吻合。
如欲查看更多验证基准,请查阅我们的2024 R2验证研究白皮书。
GPU提速带来的的价值非常明显,其对设计周期的迭代次数和时长具有正面影响,从而整体上加速了产品上市进程。那GPU电源及能源成本呢?为了了解GPU配置与CPU配置的功耗和硬件成本,Ansys进行了各种研究。
在图8所示的图表中,我们对DrivAer进行了外部空气动力学研究,规模为2.5亿个网格单元,采用大涡模拟(LES)方法,总计50,000个时间步,并在CPU配置和GPU配置上分别运行了该仿真。我们经分析发现,运行该模型的GPU硬件成本最终比在CPU硬件上运行相同的模型成本低9倍,能效提高33倍。
图8:与在CPU硬件配置上运行相同模型相比,采用4个NVIDIA A100 GPU时的成本锐降9倍。
图9:与在CPU硬件配置上运行相同模型相比,采用4个NVIDIA A100 GPU的能效锐增33倍。
GPU在功耗、能耗和时间方面的节省显著,具有明显的优势。我们对NVIDIA及AMD GPU的支持,有助于实现广泛的加速计算。此外,基于云计算的HPC解决方案也是一个很好选项。Ansys目前提供以下面向云计算及HPC技术的解决方案:
我们与以下供应商合作:
CFD正在迈向通用GPU计算时代,我们见证了这一跨越式变革,而Ansys正在引领这一发展。随着GPU的日益普及,以及越来越多的企业开始采用GPU来加速工作流程、降低成本,抢占技术先机至关重要。您可以信赖Ansys,因为其软件在速度和准确方面经过了严格且持续的基准测试,并依托一支竭诚为您提供卓越CFD软件解决方案的研发团队。
此外,Ansys也是率先采用NVIDIA Omniverse Blueprint实现实时计算机辅助工程(CAE)数字孪生的公司。NVIDIA Omniverse Blueprint是NVIDIA加速库、人工智能框架和Omniverse技术的参考工作流程,可在Ansys应用中实现物理场的实时、交互式可视化。这将帮助用户将仿真和实时可视化速度提高1,200倍。
您是第一次使用Fluent GPU求解器吗?欢迎从我们的免费学习课程开始,该课程位于“Ansys创新空间”(Ansys Innovation Space)。
欢迎在我们的Ansys帮助网站上访问Fluent GPU求解器文档页面。
还有其它问题吗?欢迎访问Fluent GPU求解器常见问题页面。
Ansys Advantage博客(The Advantage Blog)由Ansys专家和其他技术专家撰写,让您随时了解Ansys如何为创新赋能,推动人类踏上伟大征程。