Faculté des sciences et techniques de l'ingénieur STI, Section de génie électrique et électronique, Institut de génie électrique et électronique IEL (Laboratoire de traitement des signaux 1 LTS1)

Phase synchronization for classification of spontaneous EEG signals in brain-computer interfaces

Gysels, Elly ; Kunt, Murat (Dir.) ; Celka, Patrick (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2005 ; no 3397.

Ajouter à la liste personnelle
    Summary
    By directly analyzing brain activity, Brain-Computer Interfaces (BCIs) allow for communication that does not rely on any muscular control and therefore constitute a possible communication channel for the completely paralyzed. Typically, the user performs different mental tasks, that correspond to different output commands as recognized by the system. From the recorded brain signals (Electroencephalogram, EEG), features that characterize the mental tasks and allow their discrimination by a classifier have to be extracted. This dissertation addresses the extraction of features in the framework of BCIs. On the one hand, new features are proposed. On the other hand, feature selection algorithms are investigated in order to select relevant features. Currently existing BCIs mostly use power estimates in some pre-defined frequency bands, which are single-channel features. Some authors report on the use of multichannel features, but interactions between specific brain regions have not yet been studied. We propose to use the synchronization feature Phase Locking Value (PLV) for the classification of spontaneous EEG recorded during different mental tasks. It is fast to compute and can be applied to relatively short time windows, two important assets for BCI applications. In a first instance, average synchronization values are considered. Tests on offline data show that significant classification accuracies can be obtained by the sole use of PLV. This demonstrates the relevance of synchronization features for the classification of EEG in this context. We found that PLV and power features do not clearly outperform each other, but their combination often leads to significantly improved results and never significantly deteriorates the classification accuracies obtained by the separate subsets. In the next step, feature selection algorithms are investigated in order to select the most interesting features. We show that Genetic Algorithms (GAs) as well as SVM-based recursive feature elimination (SVM-rfe) select physiologically meaningful features. As they are slow (computation times on the order of days and hours respectively) and thus cannot practically be used for BCIs, a modified version of the Fast Correlation-Based Filter (FCBF) is proposed. In this study, FCBF generalizes well and achieves good classification accuracies with very few features. The correspondence of the selected EEG signals with neurophysiological evidence is even stronger than for GAs and SVM-rfe. In addition, this algorithm is fast (computation time on the order of minutes) and so it can be applied between two recording sessions. Comparing the classification results obtained with broadband and narrowband power and PLV features selected by FCBF learns that power features are preferably computed in the narrower 8–12Hz frequency band and that for PLV features, the 8–30Hz frequency band is the better one. Furthermore, FCBF is used to evaluate a set of features comprising, on the one hand, the PLV for all possible electrode pairs, PLV averages, the cluster participation index and power features (band power and statistical mean frequency (SMF)), computed from the EEG signals. On the other hand, power (total power and SMF) and synchronization features derived from the empirical mode decomposition of these signals were included. They all proved useful. It is recommended to initially consider power features and only the PLV averages, because the resulting set of features is substantially smaller than when using PLV for all possible electrode pairs. Automatic detection of artifacts and rejection of the corresponding data window for selecting the features and training the classifier, results in, if any, an increase of classification accuracy that is generally not greater than 1%, for our data. Application of global and local PCA-based denoising techniques never yielded improved results for two of the five subjects we analyzed. If it yields better results for the other 3 subjects, the increase never exceeds 1.84%. Application of the proposed methods to blind data of the third international BCI competition held in 2005 gave significant classification accuracies. This further illustrates the relevance and the potential of the investigated techniques. We conclude that PLV may complement currently used features and improve future BCI systems. PLV is well suited for BCI applications, because of its fast computation, needed for online feedback systems. The Fast Correlation-Based Filter is a valuable tool for evaluating features and selecting a subset of relevant features.
    Résumé
    Les Interfaces Cerveau-Ordinateur (BCIs) analysent directement l'activité du cerveau et permettent ainsi une communication qui ne se fonde sur aucun contrôle musculaire. Cela constitue donc une voie de communication possible pour les tétraplégiques. La plupart du temps, l'utilisateur exécute différentes tâches mentales correspondant à différentes commandes reconnues par le système. Les spécificités qui caractérisent les tâches mentales et qui permettent leur distinction par un classificateur doivent être extraites des signaux cérébraux (électroencéphalogramme, EEG). Cette thèse traite de l'extraction des caractéristiques dans le cadre de BCIs. D'une part, des nouvelles caractéristiques sont proposées. D'autre part, des algorithmes de sélection de caractéristiques sont étudiés afin de choisir les caractéristiques appropriées. La plupart des BCIs actuels utilisent la puissance dans des bandes de fréquence prédéfinies. Ce sont des caractéristiques à canal unique. Quelques auteurs proposent l'utilisation de caractéristiques multicanaux, mais les interactions entre des régions spécifiques du cerveau n'ont pas encore été étudiées. Nous proposons d'utiliser la caractéristique de synchronisation PLV (Phase Locking Value) pour la classification d'EEG spontané enregistré pendant différentes tâches mentales. Il est rapide à calculer et peut être appliqué à des fenêtres d'analyse relativement courtes. Deux atouts importants pour des applications BCI. Dans un premier temps, des valeurs moyennes de synchronisation sont considérées. Les essais sur des données analysées en temps différé montrent que des taux de classification significatifs peuvent être obtenus par l'utilisation unique de PLV. Ceci démontre la pertinence des caractéristiques de synchronisation pour la classification d'EEG dans ce contexte. Nous avons constaté que PLV et les caractéristiques de puissance ne se surpassent pas clairement, mais leur combinaison mène souvent à des résultats significativement améliorés et ne détériore jamais de manière significative les taux de classification obtenus par les sous-ensembles séparés. Dans une prochaine étape, des algorithmes de sélection de caractéristiques sont étudiés afin de choisir les caractéristiques les plus intéressantes. Nous montrons que des algorithmes génétiques (GAs) aussi bien que l'élimination récursive de caractéristiques basée sur "Support Vector Machines" (SVM-rfe) sélectionnent des caractéristiques physiologiquement significatives. Ils ne peuvent pourtant pas être utilisés de manière pratique pour BCIs car ils sont lents (temps de calcul de l'ordre de quelques jours, respectivement quelques heures). Nous proposons une version modifiée du filtre à sélection de caractéristiques par corrélation rapide (FCBF). Dans cette étude, FCBF généralise bien et réalise des bons taux de classification avec très peu de caractéristiques. La correspondance des signaux EEG sélectionnés avec l'évidence neurophysiologique est encore plus forte que pour les GAs et le SVM-rfe. En outre, cet algorithme est rapide (temps de calcul de l'ordre de quelques minutes) et peut être ainsi appliqué entre deux sessions d'enregistrement. En comparant les résultats de classification obtenus avec les caractéristiques de PLV et de puissance à bande large et à bande étroite sélectionnées par FCBF, on apprend que les caractéristiques de puissance sont de préférence calculées dans la bande de fréquence plus étroite 8–12Hz alors que pour des caractéristiques de PLV, la bande de fréquence 8–30Hz est la meilleure. En outre, FCBF est employé pour évaluer un ensemble de caractéristiques contenant d'une part le PLV pour toutes les pairs d'électrodes possibles, les moyennes de PLV, le "Cluster Participation Index" et les caractéristiques de puissance (puissance de bande et fréquence moyenne statistique (SMF)) calculés des signaux EEG et d'autre part la puissance (puissance totale et SMF) et les caractéristiques de synchronisation dérivés de la décomposition en modes empiriques de ces signaux. Ils se sont tous avérés utiles. Nous recommandons de considérer en premier lieu les caractéristiques de puissance avec les moyennes de PLV uniquement. En effet, l'ensemble de caractéristiques résultant est sensiblement plus petit en utilisant les moyennes qu'en utilisant PLV pour toutes les pairs d'électrodes possibles. Ensemble, la détection automatique des artefacts et le rejet de la fenêtre de données correspondante pour sélectionner les caractéristiques et entraîner le classificateur, résultent, le cas échéant, par une augmentation du taux de classification qui n'est généralement pas plus grand que 1% pour nos données. L'application des techniques de débruitage globales et locales basées sur PCA n'a jamais donné de résultats améliorés pour deux des cinq sujets que nous avons analysés. Si elle conduit à des meilleurs résultats pour les 3 autres sujets, l'augmentation n'excède jamais 1.84%. L'application des méthodes proposées à des données aveugle remise lors de la troisième compétition internationale de BCI (2005) a produit des taux de classification significatifs. Ceci illustre davantage la pertinence et le potentiel des techniques étudiées. Nous concluons que PLV peut compléter les caractéristiques actuellement utilisées et améliorer de futurs systèmes de BCI. PLV est bien approprié aux applications de BCI en raison de son calcul rapide, requis pour les systèmes d'analyse en temps réel, boucle fermée. Le FCBF est un outil valable pour évaluer des caractéristiques et sélectionner un sous-ensemble de caractéristiques appropriés.