Faculté des sciences de base SB, Section de mathématiques, Institut de mathématiques IMA (Chaire de statistique STAT)

Mixture models for multivariate extremes

Boldi, Marc-Olivier ; Davison, Anthony Christopher (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2004 ; no 3098.

Ajouter à la liste personnelle
    Summary
    This thesis is a contribution to multivariate extreme value statistics. The tail of a multivariate distribution function is characterized by its spectral distribution, for which we propose a new semi-parametric model based on mixtures of Dirichlet distributions. To estimate the components of this model, reversible jump Monte Carlo Markov chain and EM algorithms are developed. Their performances are illustrated on real and simulated data, obtained using new representations of the extremal logistic and Dirichlet models. In parallel with the estimation of the spectral distribution, extreme value statistic machinery requires the selection of a threshold in order to classify data as extreme or not. This selection is achieved by a new method based on heuristic arguments. It allows a selection independent of the dimension of the data. Its performance is illustrated on real and simulated data. Primal scientific interests behind a multivariate extreme value analysis reside in the estimation of quantiles of rare events and in the exploration of the dependence structure, for which the estimation of the spectral measure is a means rather than an end. These two issues are addressed. For the first, a Monte Carlo method is developed based on simulation of extremes. It is compared with classical and new methods of the literature. For the second one, an original conditional dependence analysis is proposed, which enlightens various aspects of the dependence structure of the data. Examples using real data sets are given. In the last part, the semi-parametric model and the presented methods are extended to spatial extremes. It is made possible by considering the spectral distribution as the distribution of a random probability, an original viewpoint adopted throughout this thesis. Classical multivariate extremes are extended to extremes of random measures. The application is illustrated on rainfall data in China.
    Résumé
    Cette thèse est une contribution à la statistique des valeurs extrêmes. La queue d'une fonction de répartition multivariée est charactérisée par sa distribution spectrale. Nous proposons un nouveau modèle semi-paramétrique constitué d'unmélange de distributions de Dirichlet. Pour l'estimation de ses composants, un algorithme à sauts réversibles par chaînes de Markov et un algorithme EM sont développés. Leurs performances sont illustrées sur des données réelles et simulées. Ces simulations sont obtenues grâce à une nouvelle représentation des modèles logistiques et de Dirichlet. En parallèle à l'estimation de la loi spectrale, la statistique des valeurs extrêmes requière la selection d'un seuil permettant de classer les données comme extrêmes ou non. Cette sélection est obtenue grâce à une nouvelle méthode, basée sur des arguments heuristiques, qui permet une sélection indépendante de la dimension des données. Ses performances sont illustrées sur des données réelles et simulées. L'intérêt premier d'une analyse des extrêmes réside dans l'estimation de quantiles d'événements rares et dans l'exploration de la structure de dépendance, pour lesquelles l'estimation de la mesure spectrale est un moyen plutôt qu'un but. Ces deux questions sont abordées. Pour la première, une méthode de Monte Carlo par simulation d'extrêmes est développée. Elle est comparée avec des méthodes classiques et nouvelles de la littérature. Pour la seconde, une analyse de dépendance conditionnelle originale est proposée. Elle consiste en une série de graphiques représentant des coupes de la fonction de densité spectrale. Elle éclaire diβérents aspects de la structure de dépendance des données. Des exemples sur des données réelles illustrent l'analyse. Dans la dernière partie, le modèle semi-paramétrique et les méthodes présentées sont étendues au cas spatial. Cela est rendu possible en considérant la distribution spectrale comme la loi d'une probabilité aléatoire, un point de vue adopté tout au long de cette thèse. Le cas des extrêmes multivariés s'étend alors au cas d'extrêmes de mesures aléatoires. L'application est illustrée sur un jeu de données de précipitations en Chine.