L'archivage du web : stratégies, études de cas et recommandations

Beausire, Jonas ; Dubosson Nalo, Françoise (Dir.)

Mémoire de bachelor : Haute école de gestion de Genève, 2015 ; TDB 2254.

Ce travail consiste en l’établissement d’un panorama des grandes approches et stratégies de collecte de l’archivage du web, une analyse des attentes et des résistances du public des chercheurs face à ces nouvelles archives et la présentation de pistes d’innovations et de recommandations pour mieux appréhender l’archivage du web. Une analyse approfondie de deux programmes... More

Add to personal list
    Résumé
    Ce travail consiste en l’établissement d’un panorama des grandes approches et stratégies de collecte de l’archivage du web, une analyse des attentes et des résistances du public des chercheurs face à ces nouvelles archives et la présentation de pistes d’innovations et de recommandations pour mieux appréhender l’archivage du web. Une analyse approfondie de deux programmes d’archivage – celui de la Bibliothèque nationale suisse (BN) et celui de la Bibliothèque nationale de France (BnF) – et une comparaison de ces deux modèles le complètent. Une revue générale, puis spécifique, de la littérature consacrée à l’archivage du web a été nécessaire. Les sources proviennent toutes de bases de données et du web. Des entretiens exploratoires qualitatifs semi-directifs ont été menés afin d’éclairer les points d’ombre des sources préalablement investies. Un travail de synthèse et de compilation de l’ensemble des sources et des entretiens a mené à la rédaction de ce travail. Les approches de l’archivage du web sont exposées : intégrale, exhaustive, sélective et thématique. Elles se combinent souvent sur le terrain mais doivent être repensées pour être renouvelées. Chacune d’entre-elles peut être accompagnée d’une stratégie de collecte : automatisée, semi-automatisée ou manuelle. Les logiques juridiques et patrimoniales, ainsi que les processus de travail des programmes d’archivage de la BN et de la BnF sont détaillés : l’arsenal juridique structure fondamentalement les possibilités des deux institutions. Les attentes des chercheurs, leurs besoins et résistances sont mis en lumière par des résultats d’enquêtes. Si la communauté scientifique s’accorde sur la nécessité de constituer une mémoire du web, la fiabilité et la légitimité des collections issues du web cristallisent les résistances exprimées par les chercheurs. Globalement, les questions épistémologiques et méthodologiques pour inscrire ces archives dans un usage scientifique établi ne sont pas encore résolues. Enfin, des recommandations techniques et conceptuelles sont abordées : elles mettent notamment l’accent sur la construction d’interfaces d’accès et la description des archives et de leur contexte grâce, en particulier, aux métadonnées. Une variété d’outils d’analyse du web constitue également des leviers privilégiés pour exploiter et mettre en valeur les futures archives du web.