Faculté des sciences

Conditioning groundwater flow parameters with iterative ensemble smoothers : analysis and approaches in the continuous and the discrete cases

Lam, Dan-Thuy ; Renard, Philippe (Dir.) ; Kerrou, Jaouher (Codir.)

Thèse de doctorat : Université de Neuchâtel, 2019.

L’assimilation de données consiste à combiner de façon optimale les observations (données) et les prévisions produites par un modèle numérique d’un système dynamique étudié. Au cours de la dernière décennie, les méthodes basées sur le filtre de Kalman d’ensemble (EnKF) pour l’assimilation de données ont été particulièrement explorées dans diverses disciplines des... Plus

Ajouter à la liste personnelle
    Résumé
    L’assimilation de données consiste à combiner de façon optimale les observations (données) et les prévisions produites par un modèle numérique d’un système dynamique étudié. Au cours de la dernière décennie, les méthodes basées sur le filtre de Kalman d’ensemble (EnKF) pour l’assimilation de données ont été particulièrement explorées dans diverses disciplines des géosciences pour résoudre des problèmes inverses. Bien que ces méthodes d’ensemble aient été développées afin de pouvoir traiter efficacement des problèmes de grandes dimensions, elles supposent que les erreurs qui affectent les observations et le modèle suivent une loi de distribution Gaussienne multivariée. Pour traiter de potentielles nonlinéarités entre les données et les variables paramètres ou d’état que l’on souhaite conditionner, des variantes itératives de méthodes existantes ont été proposées. Dans cette thèse, nous nous intéressons dans un premier temps à la performance de deux principales méthodes de lisseur d’ensemble itératif pour le calage d’un modèle synthétique d’écoulement souterrain 2D. A partir du même jeu de données ponctuelles (locales) et transitoires (dynamiques), nous analysons la performance de chaque méthode pour le conditionnement d’un ensemble de champs multi-Gaussiens de valeurs de conductivité hydraulique. Nous explorons ensuite plus particulièrement l’application d’une des méthodes, ES-MDA, dans des situations plus ou moins complexes suivant la méthode de simulation géostatistique employée pour représenter l’information géologique a priori. Nous évaluons tout d’abord la pertinence d’une paramétrisation basée sur une transformation normal-score dans un cas non-multi-Gaussien. La robustesse de la méthode d’ensemble face aux nonlinéarités est ensuite plus particulièrement testée dans le cas de réalisations de variables discrètes de facies géologique obtenues par la technique des gaussiennes tronquées et mises à jour via leurs variables continues sous-jacentes. En nous basant sur les limitations et avantages observées expérimentalement pour les paramétrisations précédemment évoquées, nous proposons finalement une nouvelle méthodologie d’assimilation de données dynamiques. Bien qu’elle implique une méthode classique de Kalman d’ensemble, la méthodologie proposée permet spécifiquement le conditionnement de champs de facies géologiques, soit de variables discrètes, qui sont initialement simulés par statistiques à points multiples (MPS). Cette méthodologie s’appuie sur une paramétrisation multi-résolutions nouvelle de la simulation MPS catégorique où, l’ensemble de paramètres latents est défini initialement à partir des simulations à l’échelle la plus grossière d’un ensemble de simulations MPS multi-résolutions. Comme cet ensemble n’est pas multi-Gaussien, des étapes additionnelles précédant le calcul de la première correction sont proposées. Notamment, les paramètres sont corrigés à des points prédéfinis à l’échelle la plus grossière, puis intégrés en tant que données de conditionnement pour générer une nouvelle simulation MPS multi-résolutions. Les résultats obtenus sur le problème synthétique montrent que la méthode converge vers un ensemble de réalisations catégoriques finales cohérent avec l’ensemble catégorique initial. La convergence est fiable en ce sens qu’elle est contrôlée entièrement par l’intégration de la correction de ES-MDA dans les nouvelles simulations MPS multi-résolutions conditionnelles. De plus, grâce à la paramétrisation proposée, l’identification des structures géologiques durant l’assimilation des données est particulièrement efficace pour cet exemple. La comparaison entre l’incertitude estimée et une estimation de référence obtenue avec une méthode de Monte-Carlo révèle que l’incertitude n’est pas sévèrement réduite durant l’assimilation comme cela est souvent observé. La connectivité des structures est bien reproduite durant la procédure itérative malgré la distance plutôt élevée entre les points d’observation.
    Summary
    Data assimilation (DA) consists in combining observations and predictions of a numerical model to produce an optimal estimate of the evolving state of a system. Over the last decade, DA methods based on the Ensemble Kalman Filter (EnKF) have been particularly explored in various geoscience fields for inverse modelling. Although this type of ensemble methods can handle high-dimensional systems, they assume that the errors coming from whether the observations or the numerical model are multi-Gaussian. To handle potential nonlinearities between the observations and the state or parameter variables to estimate, iterative variants have been proposed. In this thesis, we first focus on two main iterative ensemble smoother methods for the calibration of a synthetic 2D groundwater model. Using the same set of sparse and transient flow data, we analyse each method when employing them to condition an ensemble of multi-Gaussian hydraulic conductivity fields. We then further explore the application of one iterative ensemble smoother algorithm (ES-MDA) in situations of variable complexity, depending on the geostatistical simulation method used to simulate the prior geological information. The applicability of a parameterization based on the normal-score transform is first investigated. The robustness of the method against nonlinearities is then further explored in the case of discrete facies realizations obtained with a truncated Gaussian technique and updated via their underlying continuous variables. Based on the observed limitations and benefits of the forementioned parameterizations, we finally propose a new methodology for the conditioning of categorical multiple-point statistics (MPS) simulations to dynamic data with a state-of-the-art ensemble Kalman method by taking the example of the Ensemble Smoother with Multiple Data Assimilation (ES-MDA). Our methodology relies on a novel multi-resolution parameterization of the categorical MPS simulation. The ensemble of latent parameters is initially defined on the basis of the coarsest-resolution simulations of an ensemble of multi-resolution MPS simulations. Because this ensemble is non-multi-Gaussian, additional steps prior to the computation of the first update are proposed. In particular, the parameters are updated at predefined locations at the coarsest scale and integrated as hard data to generate a new multi-resolution MPS simulation. The results on the synthetic problem illustrate that the method converges towards a set of final categorical realizations that are consistent with the initial categorical ensemble. The convergence is reliable in the sense that it is fully controlled by the integration of the ES-MDA update into the new conditional multi-resolution MPS simulations. Moreover, thanks to the proposed parameterization, the identification of the geological structures during the data assimilation is particularly efficient for this example. The comparison between the estimated uncertainty and a reference estimate obtained with a Monte Carlo method shows that the uncertainty is not severely reduced during the assimilation as is often the case. The connectivity is successfully reproduced during the iterative procedure despite the rather large distance between the observation points.