Faculté des sciences

Recherche documentaire sur le Web : Les hyperliens sont-ils vraiment utiles ?

Savoy, Jacques ; Picard, Justin

In: Actes 5e Journées Analyse statistique des Données Textuelles JADT 2000, 2000, p. 27-34

Les systèmes hypertexte, les bibliothèques numériques ou le Web connaissent un intérêt grandissant. Pour trouver de l’information pertinente, la navigation à elle seule ne peut pas être vue comme un moyen efficace, surtout si l’on considère le nombre considérable de pages et de liens. Le recours à des moteurs de recherche s'avère essentiel et leur présence à permis au Web de... Plus

Ajouter à la liste personnelle
    Résumé
    Les systèmes hypertexte, les bibliothèques numériques ou le Web connaissent un intérêt grandissant. Pour trouver de l’information pertinente, la navigation à elle seule ne peut pas être vue comme un moyen efficace, surtout si l’on considère le nombre considérable de pages et de liens. Le recours à des moteurs de recherche s'avère essentiel et leur présence à permis au Web de grandir dans les proportions que nous connaissons actuellement. Cependant, ces moteurs de recherche possèdent quelques lacunes et actuellement, la grande majorité d' entre eux ignore les liens hypertexte afin d' améliorer la qualité de leurs réponses. De récents travaux touchant la recherche documentaire sur le Web semblent indiquer que les liens peuvent être utiles pour mieux dépister les documents pertinents. Malheureusement, nous ne disposons pas d' expériences rigoureuses afin de connaître l’efficacité de différentes approches possibles. Cet article présente quelques systèmes de dépistage de L'information utilisant les liens hypertexte afin d' améliorer la qualité de leurs réponses. Basée sur une collection de 2.3 Gb de pages Web et de 100 requêtes ainsi que sur une méthodologie de comparaison rigoureuse, cet article présente quelques évaluations de l’efficacité des liens dans la recherche documentaire sur le Web.
    Summary
    There is an increasing interest in hypertext systems, digital libraries and the Web. Due to the huge number of pages and links, browsing cannot be viewed as an adequate searching process, even with the introduction of subject directories or other classified lists (e.g., Yahoo!). Therefore, an effective query-based mechanism for accessing information is needed. Nowadays, search engines available on the Web are far from covering all available information, and present many drawbacks. Moreover, most of them ignore hypertext links to enhance their retrieval effectiveness. Recent work in IR on the Web seems to recognize that the hyperlink structure can be very valuable for locating information. This paper exposes some search strategies using hyperlinks. Only a few rigorous experiments deal with such large-sized networked information, and we present some preliminary experiments using a snapshot of around 2.3 Gb extracted from the Web. Our study suggests that the usefulness of interdocument relationships for searching purpose is questionable, at least as implemented actually.