Faculté des sciences de base SB, Section de mathématiques, Institut de mathématiques IMA (Chaire de statistique appliquée STAP)

Prédiction spatiale en présence d'erreurs substitutives et modélisation par drap stable

Fournier, Baptiste ; Morgenthaler, Stephan (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2007 ; no 3758.

Ajouter à la liste personnelle
    Summary
    In geostatistics, the presence of outlying data is more the rule than the exception. Moreover, the statistical analysis of data contaminated by outliers requires caution, particularly when a spatial dependence exists. In order to take into account these possible outliers during the adjustment of the spatial process, a new modeling tool, called the substitutive errors model, is proposed. The optimal prediction in the least squares sense is derived and its properties are studied. Because of its complexity, this estimator needs in practice to be numerically approximated. An automated algorithm is proposed in this thesis. This method is based on an ordering of the observations with respect to the specified spatial process of interest, with the values least in agreement being included towards the end of the ordering. It proves to be useful in case of masked multiple outliers or nonstationary clusters. Simulations are carried out to illustrate its performances and to compare it to other forecasts, robust or not. An application to real data is provided as an illustration of its practical usefulness. The second part of this work also deals with the presence of spatial heterogeneity. One could say that the proposed model offers a characterization of this heterogeneity rather than estimating the locations and sizes of outliers. It is based on the theory of bidimensional α-stable motion. This represents a generalization of the unidimensional Brownian motion. In particular, the stability parameter α can be seen as a measure of the distance between the observations and the hypothesis of a Gaussian distribution. A method of estimation for the parameters of such a process is presented, based on a numerical constrained optimization of the likelihood. Its performances are illustrated by means of simulations. An application ends this second part.
    Résumé
    L'existence de données aberrantes en géostatistique tient plus de la règle que de l'exception. Le traitement statistique de valeurs isolées nécessite la plus grande prudence, spécialement en présence d'une dépendance spatiale. Afin de tenir compte de ces éventuelles présences dans l'ajustement du processus spatial sous étude, une nouvelle modélisation, dite à erreurs substitutives, est proposée. L'estimateur optimal au sens des moindres carrés est dérivé et ses propriétés étudiées. En raison de sa complexité, cet estimateur doit en pratique être approché. Une méthode d'approximation entièrement automatisée est proposée. Elle se base sur un ordonnancement des données, de la plus en accord avec le processus d'intérêt à la plus éloignée. Cette méthode a l'avantage de bien se comporter même en cas d'effet de masquage ou en cas de valeurs aberrantes regroupées. Des simulations illustrent les performances de l'estimateur et le comparent à d'autres estimateurs de krigeage, robuste ou non. Une application à des données réelles est proposée pour illustration. La seconde partie de ce travail traite également de la présence d'hétérogénéité spatiale. Plutôt que fournir un traitement, une caractérisation de cette hétérogénéité est proposée au travers d'une nouvelle modélisation. Cette dernière se base sur la théorie des mouvements α-stables bidimensionnels. Ils représentent une généralisation à deux dimensions du mouvement brownien. En particulier, le paramètre α peut être vu comme une mesure de l'éloignement des données de l'hypothèse d'une distribution gaussienne. Une méthode d'estimation pour les paramètres d'un tel mouvement est proposée. Basée sur une optimisation numérique sous contrainte de la vraisemblance, ses performances sont éprouvées au travers de simulations. Une application clôt cette seconde partie.