中国机械工程 ›› 2025, Vol. 36 ›› Issue (9): 1942-1950.DOI: 10.3969/j.issn.1004-132X.2025.09.005
• 机械基础工程 • 上一篇
卢志伟(), 张皓茹, 刘锡尧, 王亚东, 张卓凯, 张君安
收稿日期:
2024-07-15
出版日期:
2025-09-25
发布日期:
2025-10-15
通讯作者:
卢志伟
作者简介:
卢志伟*(通信作者),男,1979年生,副教授、博士研究生导师。研究方向为流体润滑与并行计算。E-mail:luzhiwei@xatu.edu.cn。
基金资助:
Zhiwei LU(), Haoru ZHANG, Xiyao LIU, Yadong WANG, Zhuokai ZHANG, Jun'an ZHANG
Received:
2024-07-15
Online:
2025-09-25
Published:
2025-10-15
Contact:
Zhiwei LU
摘要:
为深入分析超音速流场的特性并提高数值计算效率,设计了一种高效的加速算法。该算法充分利用中央处理器-图形处理器(CPU-GPU)异构并行模式,通过异步流方式实现数据传输及处理,显著加速了超音速流场数值模拟的计算过程。结果表明:GPU并行计算速度明显高于CPU串行计算速度,其加速比随流场网格规模的增大而明显提高。GPU并行计算可以有效提高超音速流场的计算速度,为超音速飞行器的设计、优化、性能评估及其研发提供一种强有力的并行计算方法。
中图分类号:
卢志伟, 张皓茹, 刘锡尧, 王亚东, 张卓凯, 张君安. 基于CPU-GPU的超音速流场N-S方程数值模拟[J]. 中国机械工程, 2025, 36(9): 1942-1950.
Zhiwei LU, Haoru ZHANG, Xiyao LIU, Yadong WANG, Zhuokai ZHANG, Jun'an ZHANG. Numerical Simulation of N-S Equations for Supersonic Flow Fields Based on CPU-GPU[J]. China Mechanical Engineering, 2025, 36(9): 1942-1950.
计算网格 | 内核配置(grid维度) | 数值 |
---|---|---|
64×64 | (2,4) | 4096 |
128×128 | (4,8) | 16384 |
256×256 | (8,16) | 65536 |
320×320 | (10,20) | 102400 |
512×512 | (16,32) | 262144 |
表1 内核函数参数配置
Tab.1 Configuration of parameters for kernel functions
计算网格 | 内核配置(grid维度) | 数值 |
---|---|---|
64×64 | (2,4) | 4096 |
128×128 | (4,8) | 16384 |
256×256 | (8,16) | 65536 |
320×320 | (10,20) | 102400 |
512×512 | (16,32) | 262144 |
参数 | 数值 |
---|---|
平板长度L/μm | 10 |
声速a∞ /(m·s-1) | 340.28 |
压力p∞ /Pa | 101 325.0 |
温度T∞ /K | 288.16 |
比热容比γ | 1.4 |
普朗特常数Pr | 0.71 |
理想气体常数R/(J·kg-1·K-1) | 287 |
表2 流场初始参数
Tab.2 Initial parameters of the flow field
参数 | 数值 |
---|---|
平板长度L/μm | 10 |
声速a∞ /(m·s-1) | 340.28 |
压力p∞ /Pa | 101 325.0 |
温度T∞ /K | 288.16 |
比热容比γ | 1.4 |
普朗特常数Pr | 0.71 |
理想气体常数R/(J·kg-1·K-1) | 287 |
计算网格 | 最大偏差/Pa | 平均偏差/Pa |
---|---|---|
64×64 | 4.327×10-6 | 3.523×10-9 |
128×128 | 6.534×10-6 | 5.637×10-9 |
256×256 | 5.247×10-6 | 4.823×10-9 |
320×320 | 2.547×10-5 | 7.654×10-8 |
512×512 | 7.245×10-5 | 5.852×10-8 |
表3 CPU与GPU压力计算结果偏差
Tab.3 Deviation of pressure calculation results of CPU and GPU
计算网格 | 最大偏差/Pa | 平均偏差/Pa |
---|---|---|
64×64 | 4.327×10-6 | 3.523×10-9 |
128×128 | 6.534×10-6 | 5.637×10-9 |
256×256 | 5.247×10-6 | 4.823×10-9 |
320×320 | 2.547×10-5 | 7.654×10-8 |
512×512 | 7.245×10-5 | 5.852×10-8 |
计算网格 | 进程数 | CPU用时/s | GPU用时/s | 加速比 |
---|---|---|---|---|
64×64 | 4096 | 18.32 | 4.68 | 3.91 |
128×128 | 16384 | 160.39 | 30.75 | 5.22 |
256×256 | 65536 | 1506.01 | 247.90 | 6.08 |
320×320 | 102400 | 4486.02 | 573.11 | 7.83 |
512×512 | 262144 | 30 238.02 | 2988.18 | 10.12 |
表4 CPU与GPU计算时间及加速比
Tab.4 CPU and GPU computation time and acceleration ratio
计算网格 | 进程数 | CPU用时/s | GPU用时/s | 加速比 |
---|---|---|---|---|
64×64 | 4096 | 18.32 | 4.68 | 3.91 |
128×128 | 16384 | 160.39 | 30.75 | 5.22 |
256×256 | 65536 | 1506.01 | 247.90 | 6.08 |
320×320 | 102400 | 4486.02 | 573.11 | 7.83 |
512×512 | 262144 | 30 238.02 | 2988.18 | 10.12 |
[1] | 卢志伟, 张君安, 刘波. 多孔集成节流空气静压轴承数值计算与性能研究[J]. 兵工学报, 2019, 40(10):2151-2160. |
LU Zhiwei, ZHANG Jun'an, LIU Bo. Numerical Calculation and Performance Study of Aerostatic Bearing with Multi-hole Integrated Restrictor[J]. Acta Armamentarii, 2019, 40(10):2151-2160. | |
[2] | 刘深深, 罗磊, 韩青华, 等. 动量增升高升阻比飞行器横航向稳定性研究[J]. 北京航空航天大学学报, 2023, 49(11):3010-3021. |
LIU Shenshen, LUO Lei, HAN Qinghua, et al. Study on Lateral-directional Stability of a Practical High Lift-to-drag Ratio Hypersonic Vehicle with Momentum Lift Augmentation[J]. Journal of Beijing University of Aeronautics and Astronautics, 2023, 49(11):3010-3021. | |
[3] | 许翔, 张艺伦, 梅铮, 等. 汽车环境舱流场的数值模拟与实验研究[J]. 中国机械工程, 2023, 34(17):2115-2123. |
XU Xiang, ZHANG Yilun, MEI Zheng, et al. Numerical Simulation and Experimental Investigation of Flow Fields in Vehicle Climatic Chambers[J]. China Mechanical Engineering, 2023, 34(17):2115-2123. | |
[4] | 张峰, 翟季冬, 陈政, 等. 面向异构融合处理器的性能分析、优化及应用综述[J]. 软件学报, 2020, 31(8):2603-2624. |
ZHANG Feng, ZHAI Jidong, CHEN Zheng, et al. Survey on Performance Analysis, Optimization, and Applications of Heterogeneous Fusion Processors[J]. Journal of Software, 2020, 31(8):2603-2624. | |
[5] | LIU Xu, SUN Mingbo, WANG Hongbo, et al. A Heterogeneous Parallel Algorithm for Euler-Lagrange Simulations of Liquid in Supersonic Flow[J]. Applied Sciences, 2023, 13(20):11202. |
[6] | 翁跃, 张献伟, 张曦, 等. 面向计算流体力学的图形处理器资源管理[J]. 国防科技大学学报, 2022, 44(5):35-44. |
WENG Yue, ZHANG Xianwei, ZHANG Xi, et al. Graphics Processing Unit Resource Management for Computational Fluid Dynamics[J]. Journal of National University of Defense Technology, 2022, 44(5):35-44. | |
[7] | PISCAGLIA F, GHIOLDI F. GPU Acceleration of CFD Simulations in OpenFOAM[J]. Aerospace, 2023, 10(9):792. |
[8] | 徐坤浩, 聂铁铮, 申德荣, 等. 基于CPU-GPU异构体系结构的并行字符串相似性连接方法[J]. 计算机研究与发展, 2021, 58(3):598-608. |
XU Kunhao, NIE Tiezheng, SHEN Derong, et al. Parallel String Similarity Join Approach Based on CPU-GPU Heterogeneous Architecture[J]. Journal of Computer Research and Development, 2021, 58(3):598-608. | |
[9] | 陈玥丹, 肖国庆, 阳王东, 等. 基于异构系统的多级并行稀疏张量向量乘算法[J]. 计算机学报, 2024, 47(2):441-455. |
CHEN Yuedan, XIAO Guoqing, YANG Wangdong, et al. Exploiting Hierarchical Parallelism for Sparse Tensor-vector Multiplication on Heterogeneous Parallel Systems[J]. Chinese Journal of Computers, 2024, 47(2):441-455. | |
[10] | 杨峰, 罗世杰, 杨江鸿, 等. 基于GPU加速的等几何拓扑优化高效多重网格求解方法[J]. 中国机械工程, 2024, 35(4):602-613. |
YANG Feng, LUO Shijie, YANG Jianghong, et al. A GPU-accelerated High-efficient Multi-grid Algorithm for ITO[J]. China Mechanical Engineering, 2024, 35(4):602-613. | |
[11] | 黄国如, 陈志威, 曾博威. 城市洪涝模型及CPU-GPU异构并行计算技术研究进展[J]. 水利学报, 2023, 54(6):654-665. |
HUANG Guoru, CHEN Zhiwei, ZENG Bowei. Research Progress of Urban Flood Model and CPU-GPU Heterogeneous Parallel Computing Technology[J]. Journal of Hydraulic Engineering, 2023, 54(6):654-665. | |
[12] | 郑勇, 芦韡, 马永强, 等. 基于CUDA技术的先进组件中子学程序异构并行研究[J]. 核动力工程, 2021, 42():124-129. |
ZHENG Yong, LU Wei, MA Yongqiang, et al. Study on CUDA-based Heterogeneous Parallel for Advanced Assembly Neutronics Program[J]. Nuclear Power Engineering, 2021, 42(S2):124-129. | |
[13] | 张健, 李瑞田, 邓亮, 等. 面向多核CPU/众核GPU架构的非结构CFD共享内存并行计算技术[J]. 航空学报, 2024, 45(7):128888. |
ZHANG Jian, LI Ruitian, DENG Liang, et al. Shared-memory Parallelization Technology of Unstructured CFD Solver for Multi-core CPU/Many-core GPU Architecture[J]. Acta Aeronautica et Astronautica Sinica, 2024, 45(7):128888. | |
[14] | YE Chuangchao, ZHANG P J Y, WAN Zhenhua, et al. Accelerating CFD Simulation with High Order Finite Difference Method on Curvilinear Coordinates for Modern GPU Clusters[J]. Advances in Aerodynamics, 2022, 4(1):7. |
[15] | GHIOLDI F, PISCAGLIA F. Acceleration of Supersonic/Hypersonic Reactive CFD Simulations via Heterogeneous CPU-GPU Supercomputing[J]. Computers & Fluids, 2023, 266:106041. |
[16] | 张东飞, 高军辉. GPU加速高阶谱差分方法在风扇噪声中的应用[J]. 航空学报, 2024, 45(8):128941. |
ZHANG Dongfei, GAO Junhui. Application of GPU-accelerated High-order Spectral Difference Method in Fan Noise[J]. Acta Aeronautica et Astronautica Sinica, 2024, 45(8):128941. | |
[17] | ANDERSON J D. 计算流体力学基础及其应用[M]. 吴颂平,刘赵淼,译. 北京:机械工业出版社,2007. |
ANDERSON J D. Computational Fluid Dynamics[M]. WU Songping, LIU Zhaomiao,trans. Beijing:Mechanical Industry Press, 2007. |
[1] | 徐洁, 俞树荣, 严如奇, 丁雪兴, 王世鹏, 丁俊华. 柔性端面气膜密封流场分析及密封特性研究[J]. 中国机械工程, 2022, 33(06): 656-663. |
[2] | 张耀满;暴凤旭;齐培宁. 滚珠丝杠螺母副热态特性建模方法[J]. 中国机械工程, 2020, 31(20): 2486-2490,2496. |
[3] | 孙友刚1,2;董达善1;强海燕1,2;王冉1. 深海张力腿平台非线性涡激振动响应特性分析[J]. 中国机械工程, 2018, 29(14): 1666-1673. |
[4] | 黄文, 连天龙, 张兴中, 杨拉道, 高琦. 异形坯连铸离线动态二冷控制模型的研究与开发[J]. 中国机械工程, 2016, 27(12): 1643-1647. |
[5] | 周正干, 魏东, 向上. 空气耦合超声检测中衰减因素的研究 [J]. 中国机械工程, 2010, 21(19): 2350-2354. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||