Faculté informatique et communications IC, Département de systèmes de communication, Institut de systèmes de communication ISC (Laboratoire de communications audiovisuelles LCAV)

Perspectives on panoramic photography

Hasler, David ; Vetterli, Martin (Dir.) ; Süsstrunk, Sabine (Dir.)

Thèse sciences techniques Ecole polytechnique fédérale de Lausanne EPFL : 2001 ; no 2419.

Ajouter à la liste personnelle
    Summary
    Digital imaging brings a new set of possibilities to photography. For example, little pictures can be assembled to form a large panorama, and digital cameras are trying to mimic the human visual system to produce better pictures. This manuscript aims at developing the algorithms required to stitch a set of pictures together to obtain a bigger and better image. This thesis explores three important topics of panoramic photography: The alignment of images, the matching of the colours, and the rendering of the resulting panorama. In addition, one chapter is devoted to 3D and constrained estimation. Aligning pictures can be difficult when the scene changes while taking the photographs. A method is proposed to model these changes —or outliers— that appear in image pairs, by computing the outlier distribution from the image histograms and handling the image-to-image correspondence problem as a mixture of inliers versus outliers. Compared to the standard methods, this approach uses the information contained in the image in a better way, and leads to a more reliable result. Digital cameras aim at reproducing the adaptation capabilities of the human eye in capturing the colours of a scene. As a consequence, there is often a large colour mismatch between two pictures. This work exposes a novel way of correcting for colour mismatches by modelling the transformation introduced by the camera, and reversing it to get consistent colours. Finally, this manuscript proposes a method to render high dynamic range images that contain very bright as well as very dark regions. To reproduce this kind of pictures the contrast has to be reduced in order to match the maximum contrast displayable on a screen or on paper. This last method, which is based on a complex model of the human visual system, reduces the contrast of the image while maintaining the little details visible the scene.
    Résumé
    L'imagerie digitale enrichit le champ des ressources de la photographie traditionelle, notamment grâce à la disponibilité immédiate des images, et aux possibilités de traitement de ces images. La présente thèse expose certaines questions du traitement de l'image. En particulier, elle couvre les principaux aspects de la création d'images panoramiques et énonce une technique de rendu de l'image se basant sur des propriétés du système visuel humain. Le premier sujet traité est l'alignement d'un panorama de 360 degrés, qui soulève la difficulté de l'alignement de la dernière image sur la première. Dans la suite, il s'agit de la correction de la parallaxe. La parallaxe apparaît lorsque les photographies ne sont pas toutes prises depuis le même endroit. Une méthode qui consiste à segmenter la scène en plusieurs plans de profondeur est proposée pour reconstruire la scène de manière cohérente. Tout un chapitre est ensuite consacré à la couleur, ou comment corriger les incohérences de couleurs qui surviennent entre plusieurs prises de vues d'un même paysage. La partie suivante aborde le problème des discordances entre deux images, généralement causées par l'apparition ou la disparition d'un objet d'une photographie à l'autre. Contrairement à l'approche classique qui suppose que ces parties de la scène générent, lorsque deux images sont comparées points-à-points, des valeurs de comparaison totalement arbitraires, la méthode proposée caractérise ces valeurs de comparaison par une distribution calculée sur la base des histogrammes des images. Ceci restreint le problème et permet la création d'estimateurs de mouvement plus robustes que ceux utilisés jusqu'à présent. Le dernier chapitre traite la question de l'affichage d'une image de grande dynamique. Ce type d'image contient à la fois des zones très claires et des zones très sombres qui ne peuvent être reproduites à l'écran - ou sur papier - sans pertes notables de qualité : soit les zones claires apparaissent brûlées, soit les zones sombres apparaissent en noir. La méthode présentée se base sur un modèle de perception de contraste et permet de comprimer la dynamique de l'image tout en maintenant les petits détails visibles dans l'image finale.