Faculté des sciences de base SB, Section de mathématiques, Institut de mathématiques IMA (Chaire de statistique appliquée STAP)

Heterogeneity in multistage carcinogenesis and mixture modeling

Gsteiger, Sandro ; Morgenthaler, Stephan (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2006 ; no 3611.

Add to personal list
    Summary
    Carcinogenesis is commonly described as a multistage process. In a first step, a stem cell is transformed via a series of mutations into an intermediate cell having a growth advantage. Under favorable conditions, such a cell will give rise to a clone of initiated cells. Eventually, further alterations may transform a cell out of this clone into a malignant tumor cell. A mechanistic model of this process is given by the widely used two-stage clonal expansion model (TSCE). In this thesis, we take up a generalization of the TSCE, and study, how to introduce the concept of population heterogeneity into the model. We use mixture modeling, which allows to describe frailty in a biologically meaningful way. In a first part, we focus on theoretical properties of the extended model. Especially identifiability is discussed extensively. In a second part, we fit the model to human cancer incidence data. We analyze a situation, in which maximum likelihood estimation fails, and describe alternatives for statistical inference. The applications show that good fits are achieved only when the mixing distribution separates the population clearly into a large, virtually immune group, and into a small, high risk group.
    Résumé
    De manière générale, la carcinogénèse est décrite comme un processus à étapes multiples. Dans une première phase, une cellule souche subit des mutations qui ont l'effet de lui donner la capacité d'une croissance accélérée. Sous des conditions favorables, une telle cellule donnera lieu à un clone de cellules initiées. Dans une deuxième phase, une cellule initiée est transformée en cellule de cancer. Le modèle à deux étapes avec expansion clonale (DEEC) est un modèle méchaniste souvent utilisé pour modéliser la carcinogénèse. Le but de cette thèse consiste à introduire la notion d'hétérogénéité dans le modèle DEEC. On va utiliser les modèles mélangés à cette fin. Cette méthodologie nous donne la possibilité d'introduire la notion de fragilité d'une manière à avoir un sens biologique. Nous discutons d'abord les propriétés théoriques du modèle. En particulier, nous étudions en détail l'identifiabilité. Ensuite, nous montrons des applications du modèle à des données d'incidence chez l'homme. Nous sommes confrontés à une situation, dans laquelle l'estimation par maximum de vraisemblance échoue, ce qui nous amène à proposer des alternatives. Les applications suggèrent une population qui consiste de deux groupes, dont un est à risque très bas.