Faculté informatique et communications IC, Section des systèmes de communication, Institut de systèmes de communication ISC (Laboratoire de communications audiovisuelles 2 LCAV2)

Configural and perceptual factors influencing the perception of color transparency

Gerardin, Peggy ; Süsstrunk, Sabine (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2005 ; no 3181.

Ajouter à la liste personnelle
    Summary
    The mechanisms by which the brain represents colors are largely unknown. In addition, the large number of color phenomena in the natural world has made understanding color rather difficult. Color transparency perception, which is studied in this thesis, is precisely one of these interesting phenomena: when a surface is seen both in plain view and through a transparent overlay, the visual system still identifies it as a single surface. Processes of the visual system have widely inspired researchers in many domains such as neurosciences, psychology, as well as computer vision. The progress of digital imaging technologies requires research engineers to deal with issues that demand knowledge of human visual processing. To humans, an image is not a random collection of pixels, but a meaningful arrangement of regions and objects. One thus can be inspired by the human visual system to investigate color representation and its applicability to digital image processing. Finding a model of perception is still a challenging matter for researchers among multidisciplinary fields. This thesis discusses the problem of defining an accurate model of transparency perception. Despite the large number of studies on this topic, the underlying mechanisms are still not well understood. Investigating perceptual transparency is challenging due to its interactions with different visual phenomena, but the most intensively studied conditions for perceptual transparency are those involving achromatic luminance and chromatic constraints. Although these models differ in many aspects, a broad distinction can be drawn between models of additive and subtractive transparency. The General Convergence Model (GCM) combines both additive and subtractive color mixtures in showing that systematic chromatic changes in a linear color space, such as translation and convergence (or a combination of both), lead to perceptual transparency. However, while this model seems to be a necessary condition, it is not a sufficient one for transparency perception. A first motivation of this thesis was to evaluate and define situations more general than the GCM. Several chromatic changes consistent or not with the GCM were generated. Additional parameters, such as configural complexity, luminance level, magnitude of the chromatic change and shift direction were tested. The main results showed that observers' responses are influenced by each of the above cited parameters. Convergences appear significantly more transparent when motion is added for bipartite configurations, or when they are generated in a checkerboard configuration. Translations are influenced by both configuration and motion. Shears are described as opaque, except when short vector lengths are combined with motion: the overlay tends to be transparent. Divergences are strongly affected by motion and vector lengths, and rotations by a combination of checkerboard configuration with luminance level and vector length. These results question the generality of the GCM. We also investigated the effects of shadows on the perception of a transparent filter. An attempt to extend these models to handle transparency perception in complex scenes involving surfaces varying in shape and depth, change in conditions of illumination and shadow, is described. A lightness-matching task was performed to evaluate how much constancy is shown by the subject among six experimental conditions, in which shadow position, shadow blur, shadow and filter blending values were varied. The results showed that lightness constancy is very high even if surfaces were seen under both filter and shadow. A systematic deviation from perfect constancy in a manner consistent with a perceived additive shift was also observed. Because the GCM includes additive mixture and is related to color and lightness constancy, these results are promising and may be explained ultimately by this model.
    Résumé
    Les mécanismes par lesquels le cerveau se représente la couleur sont encore méconnus. De plus, le grand nombre de phénomènes colorés traités rend la tâche encore plus difficile. La perception de la transparence colorée, qui est étudiée dans cette thèse, est justement l'un de ces phénomènes : lorsqu'une surface est vue à la fois sous un filtre et en dehors, le système visuel l'identifie comme une seule et même surface. Les processus de traitement du système visuel ont largement inspiré les chercheurs dans des domaines aussi variés que les neurosciences, la psychologie et les sciences de l'informatique. Les progrès grandissants des technologies de l'imagerie numérique incitent les chercheurs à acquérir des connaissances sur le traitement visuel humain. Pour lui, une image n'est pas une collection de pixels, mais un arrangement de régions et d'objets qui a un sens. Il serait donc utile d'en être inspiré pour explorer la représentation de la couleur et ses applications dans le traitement de l'image numérique. Cette thèse traite du problème de définition d'un modèle précis de la perception de la transparence. Malgré le grand nombre d'études sur ce sujet, les mécanismes sous-jacents à ce phénomène sont encore peu compris. Explorer la perception de la transparence est un défi, dû à ses interactions avec de nombreux phénomènes visuels. Cependant, les modèles les plus étudiés sont ceux relatifs à la luminance achromatique et aux contraintes chromatiques. Même si ces modèles diffèrent par de nombreux aspects, ils peuvent être divisés en deux: les modèles de transparence additifs et soustractifs. Le Modèle Général de Convergence (GCM) combine ces deux mixtures de couleurs et montrent que des changements chromatiques systématiques dans un espace de couleurs linéaire, tels qu'une tranlation ou une convergence (ou bien la combinaison des deux), permettent la perception de la transparence colorée. Seulement, ce modèle est une condition nécessaire mais non suffisante à cet effet. Nous avons évalué et défini dans cette thèse des situations plus générales que celles qu'englobe le GCM. Plusieurs changements chromatiques cohérents et non cohérents avec ce modèle ont été générés. Des paramètres supplémentaires, tels que la complexité de la configuration, le niveau de luminance, la magnitude des changements et leurs directions ont été testés. Nos résultats montrent que les réponses des sujets sont influencées par chacun de ces paramètres. Les convergences apparaissent plus transparentes lorsque le mouvement du filtre est ajouté pour les configurations de type bipartite, ou bien lorsqu'elles sont générées pour des configurations de type damier. Les translations sont influencées par tous les paramètres. Les cisaillements sont décrits comme opaques, excepté pour les petites longueurs de vecteur. Les divergences sont fortement affectées par le mouvement, et les rotations par une combinaison entre la configuration de type damier, la luminance et les longueurs de vecteur. Ces résultats mettent en péril la généralité du GCM. Nous avons aussi exploré les effets des ombres sur la perception de la transparence. Une tentative d'étendre ces modèles perceptifs à des scènes plus complexes, incluant des surfaces dont varient la forme, la profondeur, les conditions d'éclairage et les ombres a été entreprise. Une tâche d'appariement a été adoptée à travers six expériences testant la constance à la luminosité d'un sujet, dans lesquelles la position de l'ombre, sa netteté et son intensité variaient. Nos résultats montrent une déviation systématique de la constance parfaite, de manière cohérente avec la perception d'un changement additif, et pourront ainsi être expliqués plus tard par le GCM.