Enrichissement des dépôts institutionnels suisses : vers une couverture complète de la publication académique ouverte : stratégie d’automatisation du moissonnage de plein-textes

Putallaz, Matthieu ; Schwob, Elodie ; Ruch, Patrick (dir.)

(Travail de recherche réalisé dans le cadre du Master of Science HES-SO en Sciences de l'information à la Haute école de gestion de Genève (HEG-GE), Filière Information documentaire, 2018)

La publication d’articles scientifiques est le vecteur principal de la diffusion de l’information scientifique et de l’état d’avancement de la recherche. Les nouvelles possibilités de diffusion et de publication amenées par l’Open Access ont résolument modifié l’accès au contenu scientifique et positionnent les universités et les hautes écoles comme des acteurs incontournables... Plus

Ajouter à la liste personnelle
    Résumé
    La publication d’articles scientifiques est le vecteur principal de la diffusion de l’information scientifique et de l’état d’avancement de la recherche. Les nouvelles possibilités de diffusion et de publication amenées par l’Open Access ont résolument modifié l’accès au contenu scientifique et positionnent les universités et les hautes écoles comme des acteurs incontournables dans la mise à disposition de la publication académique. En Suisse, ces institutions proposent des dépôts institutionnels qui ont la vocation de rendre accessible l’ensemble des publications de leurs chercheurs. Ces dépôts sont-ils complets ? S’ils ne le sont pas, est-il possible de créer une méthode automatique pour tendre à leur exhaustivité ? Dans ce travail de recherche, nous proposons d’estimer le taux de couverture d’articles en plein-texte des dépôts institutionnels en les comparant aux résultats d’archives ouvertes de plus grande envergure. Ainsi, nous avons comparé la disponibilité des articles accessibles en plein-texte de sept dépôts institutionnels suisses (Edoc, Boris, ReroDoc, Serval, Archive Ouverte, Zora et Infoscience) à deux archives ouvertes (HAL et PMC). Les résultats de notre recherche indiquent que les dépôts institutionnels ne possèdent que 35,5% d’articles en plein-texte et qu’ils pourraient atteindre une couverture totale maximale de 74,8%. C’est donc l’opportunité, pour les institutions suisses, de plus de doubler leur couverture. Mais la diversité de licences des articles et la difficulté de les repérer est un réel défi pour les personnes qui gèrent ces dépôts. Nous avons dans un deuxième temps modélisé une stratégie d’automatisation de la collecte de ces articles et en avons testé la faisabilité. La stratégie développée utilise Crossref et Open Access Button afin d’identifier les articles affiliés à une université et en trouver le plein-texte. Sur un échantillon de 141 notices, présentes en texte intégral à 43% sur deux dépôts test, notre stratégie permettrait de récolter 16% de plein-textes supplémentaires. Nous avons néanmoins rencontré un problème de taille dans l’identification des articles affiliés à des institutions spécifiques. En effet, dans le cas de l’Université de Lausanne, sur 200 notices testées, nous avons rencontré 36 appellations différentes alors que seules 4 appellations sont acceptées institutionnellement.