Faculté des sciences

Une approche uniforme pour la reconnaissance de la structure physique de documents composites fondée sur l'analyse des espaces

Azokly, Antoine Sourou ; Ingold, Rolf (Dir.) ; Stamon, Georges (Codir.)

Thèse de doctorat : Université de Fribourg : 1995 ; 1105.

Nous présentons dans cette thèse une approche d’analyse uniforme pour la reconnaissance de la structure physique des documents à contenu varié. Après une introduction à la problématique traitée dans cette thèse, nous présentons une synthèse des traitements usuels dans le domaine de la reconnaissance des documents. Dans cette synthèse, nous présentons aussi les structures usuelles... Plus

Ajouter à la liste personnelle
    Résumé
    Nous présentons dans cette thèse une approche d’analyse uniforme pour la reconnaissance de la structure physique des documents à contenu varié. Après une introduction à la problématique traitée dans cette thèse, nous présentons une synthèse des traitements usuels dans le domaine de la reconnaissance des documents. Dans cette synthèse, nous présentons aussi les structures usuelles de représentation et les normes régissant les documents. La suite est consacrée à la recherche que nous avons menée. Nous commençons notre analyse par une modélisation des documents composites auxquels nous nous sommes intéressés. Dans cette partie, nous d’écrivons la structure physique générique des documents composites ainsi qu’une modélisation des espaces inoccupés (le fond) dans les documents. Notre étude systématique des espaces débouche d’une part, sur un ensemble de règles servant à guider la reconnaissance des microstructures et, d’autre part, sur un nouveau langage de description des classes de documents que nous utilisons pour guider la reconnaissance des macrostructures. Pour la reconnaissance de la structure physique des documents composites, nous avons développé une approche d’analyse qui est à la fois uniforme et capable d’estimer de façon automatique tous les paramètres utiles à son bon fonctionnement. Cette approche, fondée sur une modélisation des espaces et combinant une stratégie d’analyse ascendante avec une autre descendante, se compose de deux niveaux d’analyse: 1. La reconnaissance des microstructures est guidée par des règles que nous avons établies lors de notre modélisation des aspects graphiques usuels des microstructures. Cette reconnaissance commence par une classification des composantes connexes. L’analyse des blocs de texte et des expressions mathématiques est réalisée par une méthode de fusion hiérarchique suivant des règles. L’analyse des tableaux est réalisée par une méthode mixte, combinant une approche de fusion hiérarchique et une autre de découpe hiérarchique. 2. La reconnaissance des macrostructures complète celle des microstructures. Elle débute par une segmentation des documents en régions et finit par une segmentation des régions en blocs. La segmentation en régions est guidée par une description de la classe du document traité, alors que la segmentation d’une région en blocs est réalisée par une méthode de découpe hiérarchique. Les seuils métriques de segmentation utilisés ont été estimés de façon automatique au moyen d’une méthode générale basée sur une étude statistique des espaces inoccupés. La dernière partie du mémoire est consacrée à l’évaluation aussi bien qualitative que quantitative des méthodes de reconnaissance développées ainsi qu’à une synthèse des travaux réalisés.
    Summary
    We present in this thesis a uniform approach to recognize the physical structure of printed documents that may contain various kinds of blocks: we call such documents composite documents. After an introduction to the subject of this thesis, we present first the state of the art in the field of document recognition. In this part, we present models and standards used to represent document structures. The remaining part of this report is devoted to our own research. We start our study by modelling the composite documents. In this part, we describe the generic physical structure of composite documents as well as a modelling of white spaces (background) in such documents. Our systematical study of white spaces in documents leads, on one hand, to a set of rules that we use to guide microstructure recognition and, on the other hand, to a new language to describe a common layout of documents which are members of a same class. Such descriptions have been used to guide macrostructure recognition. Based on the white spaces modelling, we have developed a uniform approach enabling us to recognize the physical structure of composite documents and to estimate automatically all parameters used. Our approach, combining both ascending and descending strategies, consists of two levels: 1. The microstructure recognition: this process is guided by rules we have developed to model the usual graphical aspect of microstructures. The recognition is based on a connected component classification. The analysis of textual blocks, as well as mathematical expressions, is realized by a hierarchically merging method, while tables are analysed by a hierarchically splitting method. 2. The macrostructure recognition: this process starts by segmenting a document into regions and finishes by segmenting the regions into blocks. The segmentation into regions is guided by a description of the document class. The region segmentation into blocks is realized by a hierarchically splitting method. All metric parameters used for segmentation have been automatically estimated by a general method we have defined; this method is based on a statistical study of white spaces. The last part of this thesis presents a qualitative as well as a quantitative evaluation of the developed recognition methods. This report is concluded by a synthesis.