Faculté des sciences

Hyperliens et recherche d’information sur le Web

Savoy, Jacques ; Rasolofo, Yves

In: Actes 7e journées Analyse statistique des Données Textuelles JADT 2004, 2004, p. 1000-1007

Les moteurs de recherche s’avèrent des outils indispensables afin de retrouver de l’information sur Internet. Cependant, les usagers ne désirent pas toujours une liste de sites répondant à leurs requêtes mais souhaitent obtenir un site comme unique réponse (recherche d’une page d’accueil ou d’un service en-ligne). D’autre part, nous voulons parfois extraire une liste des... Plus

Ajouter à la liste personnelle
    Résumé
    Les moteurs de recherche s’avèrent des outils indispensables afin de retrouver de l’information sur Internet. Cependant, les usagers ne désirent pas toujours une liste de sites répondant à leurs requêtes mais souhaitent obtenir un site comme unique réponse (recherche d’une page d’accueil ou d’un service en-ligne). D’autre part, nous voulons parfois extraire une liste des ressources clés ayant trait à un domaine précis. Dans ce cas, nous ne cherchons pas toutes les pages sur un thème mais souvent des bons points de départ pour la navigation. Cet article décrit notre système de recherche capable de répondre à ces deux types d’interrogation en recourant aux hyperliens afin d’accroître la qualité des réponses. Une évaluation basée sur une collection de pages Web (18,1 GB) indiquent que la présence des hyperliens permet d’accroître la qualité du dépistage.
    Summary
    Today search engines are very useful tools for retrieving information on the Web. When submitting a query however users may not always be interested in retrieving long lists of sites; rather they may prefer only a single Web site (e.g., when looking for a given homepage, an on-line service or a named page). Or, they may be only seeking useful starting points from which to browse a given topic; thus the system should respond with a list of key resources on a given subject (topic distillation). This paper describes our search system that would respond to these two search types and how its reliance on hyperlinks enhances retrieval effectiveness. Using a relatively large Web test collection (18.1 GB), an evaluation of our strategy indicates that the presence of hyperlinks improves search precision and that our system provides performance levels superior to those of other models.