Faculté des sciences

Recherche d'information distribuée : approches pour la sélection de collections et la fusion de listes de résultats

Rasolofo, Yves ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2002 ; 1611.

Une vue simplifiée d'un système de recherche d'information distribuée fait intervenir des serveurs de collections (ou des moteurs de recherche) et un courtier (métamoteur). Le courtier transmet une requête soumise par un utilisateur à un sous-ensemble de serveurs de collections. Les serveurs sélectionnés sont ceux qui ont une forte probabilité de contenir des documents pertinents à... Plus

Ajouter à la liste personnelle

Autres fichiers

    Résumé
    Une vue simplifiée d'un système de recherche d'information distribuée fait intervenir des serveurs de collections (ou des moteurs de recherche) et un courtier (métamoteur). Le courtier transmet une requête soumise par un utilisateur à un sous-ensemble de serveurs de collections. Les serveurs sélectionnés sont ceux qui ont une forte probabilité de contenir des documents pertinents à cette requête. Cette première étape est communément appelée « sélection de collections ». Chaque collection ainsi sélectionnée traite la requête et retourne une liste de documents au courtier. Finalement, le courtier fusionne en une seule liste les différentes listes qu'il a reçues à l'utilisateur. On parle alors de « Fusion de résultats ». Ce travail propose des nouvelles approches pour la « sélection de collections » et la « fusion de résultats ». Le détail de ces approches et des évaluations que nous avons effectuées est exposé dans les différentes publications incluses dans ce rapport. Ces publications ont été acceptées dans des conférences et des revues de renommée internationale.
    Summary
    A simple distributed information retrieval system is made up of collection servers (or search engines) and a broker (or metasearcher). The broker forwards a request submitted by a user to a carefully selected subset of collections servers, those which are likely to contain relevant documents to the query ("collections selection"). Each selected collection server processes the query and returns a ranked list of documents to the broker. Finally, the broker merges the received results lists into a single list ("results merging") and forwards it to the user. This work proposes new effective approaches to "collections selection" and "results merging". Details on those approaches and the evaluations we made are given in the enclosed papers. Those papers are published in well known conferences and journals.