Faculté informatique et communications IC, Département de systèmes de communication, Institut de systèmes de communication ISC (Laboratoire de communications audiovisuelles LCAV)

Directional multiresolution image representations

Do, Minh N. ; Vetterli, Martin (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2001 ; no 2500.

Ajouter à la liste personnelle
    Summary
    Efficient representation of visual information lies at the foundation of many image processing tasks, including compression, filtering, and feature extraction. Efficiency of a representation refers to the ability to capture significant information of an object of interest in a small description. For practical applications, this representation has to be realized by structured transforms and fast algorithms. Recently, it has become evident that commonly used separable transforms (such as wavelets) are not necessarily best suited for images. Thus, there is a strong motivation to search for more powerful schemes that can capture the intrinsic geometrical structure of pictorial information. This thesis focuses on the development of new "true" two-dimensional representations for images. The emphasis is on the discrete framework that can lead to algorithmic implementations. The first method constructs multiresolution, local and directional image expansions by using non-separable filter banks. This discrete transform is developed in connection with the continuous-space curvelet construction in harmonic analysis. As a result, the proposed transform provides an efficient representation for two-dimensional piecewise smooth signals that resemble images. The link between the developed filter banks and the continuous-space constructions is set up in a newly defined directional multiresolution analysis. The second method constructs a new family of block directional and orthonormal transforms based on the ridgelet idea, and thus offers an efficient representation for images that are smooth away from straight edges. Finally, directional multiresolution image representations are employed together with statistical modeling, leading to powerful texture models and successful image retrieval systems.
    Résumé
    La représentation adéquate de l'information visuelle est à la base des techniques de traitement du signal, de compression et d'identification de structure. Par représentation adéquate on entends la description succincte et précise d'une partie de la scène qui soit digne d'intérêt. En pratique, cette description doit être générée par des transformations structurelles et des algorithmes rapides. Récemment, il est apparut évident que les transformations usuelles de type séparables, telles que la transformée en ondelettes, ne représentent pas la panacée des outils de traitement de l'images. Le besoin de disposer d'outils permettant l'identification de la structure géométrique d'une scène se fait ainsi sentir. Cette thèse met l'accent sur la recherche de nouvelles techniques permettant une description "rééllement bidimensionelle" de l'image, et plus particulièrement sur les méthodes discrètes qui conduisent à des algorithmes utilisables en pratique. La première technique construit une décomposition multi-résolution, locale et directionnelle de l'image en utilisant un banc de filtre multidimensionnel. Cette décomposition est développée en analogie avec la récente transformation en "curvelets" utilisée dans le domaine de l'analyse harmonique, et fournit une description compacte des fonction bidimensionelles continues par morceau, qui sont considérées comme de bonnes représentations des images naturelles. Le lien entre les courbelettes et les bancs de filtre est démontrée dans un cadre nouvellement définit d'analyse multi-résolution directionnelle. La seconde technique présentée dans cette thèse construit une nouvelle famille de transform ées directionnelle orthogonales en blocs basée sur l'idée des "ridgelets", qui offre une représentation adéquate des images qui sont régulières hors des zones de contours rectilignes. Finalement, la représentation directionnelle et multi-résolution des images est utilisée conjointement avec des méthodes statistiques permettant ainsi la création de modèles de textures performants ainsi que la création d'outils puissants de recherches d'images par contenu.