Application de la régression quantile et ses tests statistiques sur les données PISA en Suisse romande

Eboulet, Eric ; Matei, Alina

(Document de travail ; 13.1001)

Dans le cadre des enquêtes du Programme international pour le suivi des acquis des élèves (PISA), on s’intéresse habituellement à des moyennes de scores des élèves. Une démarche plus informative est de considérer non pas les moyennes de ces scores, mais leurs quantiles. On définit le qe quantile des scores observés comme la valeur xq qui a la propriété suivante : q% des scores sont... Plus

Ajouter à la liste personnelle
    Résumé
    Dans le cadre des enquêtes du Programme international pour le suivi des acquis des élèves (PISA), on s’intéresse habituellement à des moyennes de scores des élèves. Une démarche plus informative est de considérer non pas les moyennes de ces scores, mais leurs quantiles. On définit le qe quantile des scores observés comme la valeur xq qui a la propriété suivante : q% des scores sont plus petits que xq et (1􀀀q)% sont plus grands que xq sur l’échelle des scores ordonnés. Les performances des élèves faibles sont ainsi associées aux quantiles de petit ordre de la distribution des scores et celles des élèves performants aux quantiles de grand ordre. Les scores calculés dans le cadre de l’enquête PISA sont en général modélisés à l’aide d’une régression linéaire basée sur la méthode des moindres carrés ordinaires (MCO). Le but est d’obtenir un modèle capable d’expliquer une partie de la variance des scores moyens, étant donné certaines caractéristiques des élèves ou de leurs écoles. Cependant, dans l’établissement d’un modèle MCO, les quantiles de la distribution empirique des scores, et en particulier les scores extrêmes, sont ignorés. Le choix d’une telle méthode a donc des conséquences sur la modélisation des scores extrêmes, caractérisant les élèves faibles ou performants. Une alternative est l’utilisation de la régression quantile que nous employons ici. Notre démarche est déterminée par les développements récents des tests statistiques basés sur les quantiles (Furno, 2011; Li et al., 2012). Ces tests permettent de construire des modèles de régression non seulement au centre de la distribution des scores, mais également aux extrémités, et d’étudier ainsi les scores des élèves faibles ou performants. À l’aide de ces tests statistiques, nous mettons en évidence également des différences cantonales au niveau de certains quantiles de la distribution empirique des scores et des similitudes à d’autres quantiles. Notre exemple s’appuie sur les données PISA Suisse romande en 2006.