Acceleration of an Unstructured Compressible Flow Solver using Implicit Methods and Graphics Cards

Pueblas Sánchez-Guerra, Jesús (2017). Acceleration of an Unstructured Compressible Flow Solver using Implicit Methods and Graphics Cards. Tesis (Doctoral), E.T.S.I. Aeronáuticos (UPM) [antigua denominación]. https://doi.org/10.20868/UPM.thesis.47388.

Descripción

Título: Acceleration of an Unstructured Compressible Flow Solver using Implicit Methods and Graphics Cards
Autor/es:
  • Pueblas Sánchez-Guerra, Jesús
Director/es:
  • Corral García, Roque
Tipo de Documento: Tesis (Doctoral)
Fecha: Junio 2017
Materias:
Escuela: E.T.S.I. Aeronáuticos (UPM) [antigua denominación]
Departamento: Motopropulsión y Termofluidodinámica [hasta 2014]
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (3MB) | Vista Previa

Resumen

Un método implícito basado en aristas para resolver numéricamente en mallas no estructuradas las ecuaciones tridimensionales de Navier-Stokes promediadas de Reynolds ha sido implementado. Dicho método está basado en la matriz Jacobiana aproximada de primer orden y es capaz de correr tanto en Unidades Centrales de Procesamiento (CPUs) como en Unidades Gráficas de Procesamiento (GPUs). El objetivo de este trabajo es acelerar los tiempos de convergencia e incrementar la robustez de un código explícito existente de cinco pasos de Runge-Kutta precondicionado con el método de multi-malla, el cual tiende a oscilar para ciertas configuraciones de turbomaquinaria, tales como burbujas de recirculación o flujos de cortadura, los cuales son comunes en sellos, condiciones fuera de diseño y flujo en cavidades. Un análisis bidimensional de Fourier de las diferentes técnicas implícitas se ha estudiado con el fin de entender el comportamiento del método en comparación con el esquema explícito Runge-Kutta. Tres resolvedores de sistemas lineales han sido implementados: Jacobi,LU-SGS y GMRES. El últmo es precondicionado por los métodos de Jacobi o LU-SGS para acelerar su convergencia. La implementación satisfactoria para correr en GPUs se ha alcanzado, obteniendo unos factores de aceleración entre una GPU NVIDIA GeForce GTX780Ti y una CPU Intel Xeon Processor E5-1620 del orden de 41 y 36 para los métodos de Jacobi y GMRES+LU-SGS respectivamente, mientras que para el código existente de Runge-Kutta la aceleración es aproximadamente de 26. El óptimo del tiempo de convergencia para el algoritmo implícito se observa entre un cierto rango del paso de tiempo y de iteraciones para resolver el sistema lineal. Cuando el sistema lineal se resuelve con el método de Jacobi, el CFL óptimo se encuentra alrededor de 20, necesitando entre 5 y 10 iteraciones lineales. Estos números han sido corroborados empíricamente con simulaciones tridimensionales y estudios teóricos. Los parámetros para el método GMRES+LU-SGS son muy similares. Varios casos de prueba se han simulado para validar el código, prestando atención en flujo de cavidades. Finalmente, el nuevo resolvedor se ha usado para evaluar la influencia de los flujos de sellado sobre los flujos secundarios de las turbinas de baja presión. Los datos experimentales obtenidos en una instalación de ensayos de una turbina a gran escala situada en la Universidad de Darmstadt se han usado para validar el método numérico. El efecto del aire de sellado es analizado, variando el flujo másico de refrigeración para dos condiciones de operación. La penetración del flujo de sellado en la corriente principal se incrementa con el flujo de refrigeración, desplazando los vórtices de herradura y de pasaje hacia la mitad del canal, y por consiguiente, reduciendo la eficiencia de la turbina. Este trabajo demuestra por primera vez el beneficio de usar de forma conjunta mallas no estructuradas, métodos implícitos y GPUs en un entorno típico industrial. ABSTRACT An implicit unstructured edge-based three-dimensional RANS equations solver which executes both in Central Processing Units (CPUs) and Graphics Processing Units (GPUs) has been implemented. The goal of this work is to accelerate the convergence to the steady state as well as increase the robustness of an existing multigrid methods which uses a five-stage Runge- Kutta method as smoother. This type of methods tends to oscillate in turbomachinery including recirculation bubbles or shear flows, which are common in tip gaps, off-design conditions and cavity flows. A two-dimensional Fourier analysis of different implicit techniques has been conducted in order to understand the behaviour of the method, and bench-mark it against an explicit Runge-Kutta scheme. Three different methods have been implemented to solve the sparse system of linear equations resulting from the implicit method, namely: Jacobi, LU-SGS and GMRES. The latter is preconditioned either by the Jacobi or the LU-SGS methods to accelerate its convergence. An efficient implementation on GPUs devices has been achieved, obtaining a speed-up between an NVIDIA GeForce GTX780Ti GPU and an Intel Xeon Processor E5-1620 of about 41 and 36 for the Jacobi and the GMRES+LU-SGS solvers respectively, whereas for the existing Runge-Kutta solver the speed-up is about 26 for the same hardware.. The minimum convergence time for the Jacobi implicit solver is obtained for CFL numbers of about 20 and between 5 to 10 inner iterations. These figures have been corroborated empirically by means of three-dimensional simulations and theoretical studies. The parameters for the GMRES+LU-SGS solver are similar. Several tests cases have been simulated to validate the code, paying attention to cavity flows. Finally, the new solver has been used to assess the influence of the sealing flows on the secondary flows of a low-pressure turbine. The experimental data were obtained at the Large Scale Turbine Rig at Technische Universität Darmstadt within the context of the European project MAGPI. The effect of the sealing air is analysed, varying the cooling mass flow for two operating conditions. The penetration of the sealing flow in the main stream increases with the cooling flow, displacing the horseshoe and passage vortices towards the mid-span, and hence reducing the turbine efficiency. This piece of work demonstrates for the first time the benefit of using together unstructured grids, implicit methods and GPUs in an industrial representative environment.

Más información

ID de Registro: 47388
Identificador DC: http://oa.upm.es/47388/
Identificador OAI: oai:oa.upm.es:47388
Identificador DOI: 10.20868/UPM.thesis.47388
Depositado por: Archivo Digital UPM 2
Depositado el: 31 Ago 2017 06:42
Ultima Modificación: 27 Feb 2018 23:30
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM