SONAR|HES-SO

SONAR|HES-SO

SONAR|HES-SO regroupe les travaux de bachelor et master diffusables de plusieurs écoles de la HES-SO. Consultez cette page pour le détails.

En cas de question, merci de contacter les bibliothécaires de la HES-SO : bibliotheques(at)hes-so.ch

Master thesis

Évaluation de l’impact de l’utilisation de méthodes de fouille de données pour améliorer la qualité de l’information du trafic maritime de matière première

    2020

128 p.

Mémoire de master: Haute école de gestion de Genève, 2020

French À l’ère où le volume, la variété et la vélocité des données sont en constante augmentation, le développement d’outils de scraping et l’exploitation des données disponibles dans le Web public représentent non seulement une opportunité formidable mais également un défi de taille pour les entreprises qui souhaitent les exploiter. Alors que celles-ci sont utilisées dans la prise de décisions, la qualité de ces données est d’une importance cruciale. Une fois collectées, l’utilisateur doit s’assurer que ces données sont fiables et pertinentes. Une évaluation objective permet à l’utilisateur de cerner le potentiel des données tout en limitant les coûts quant à leur traitement ainsi que la prise de décisions reposant sur des données erronées. Mandaté par Riverlake, ce travail a pour objectif de proposer une méthodologie d’évaluation de la qualité des données issues de onze ports commerciaux et d’en mesurer l’impact sur les données déjà à la disposition de l’entreprise grâce au système AIS. Dans sa première partie, cette étude passe en revue les spécificités et les limites de ce système. Ensuite, il est question d’appréhender ce que signifie la qualité des données et comment cette dernière peut être évaluée à l’aide d’un processus de Data Quality Assessment (DQA). Reposant sur les dimensions de la qualité identifiées dans la littérature scientifique, et confrontées aux besoins de notre mandat par le biais d’un questionnaire, sept dimensions ont finalement été mesurées dans le but de fournir une évaluation globale chiffrée des données récoltées sur le Web public. Avec un résultat de 79,74%, cet indice global de qualité démontre que les données récoltées sont efficaces dans l’amélioration et l’enrichissement des données à disposition de Riverlake. Cependant, l’absence de benchmarks pour comparer les résultats de cette étude nuance sa portée. Sur la base de cette étude et des limites décelées, nous recommandons de : réfléchir à la création des benchmarks tant pour évaluer les dimensions que pour l’indice globale, identifier des pondérations pour l’indice global qui soient en accord avec les besoins et le contexte de travail de notre mandant, considérer le traitement des données après scraping comme une étape importante de l’amélioration de la qualité générale des données et enfin que les sources utilisées lors d’un scraping doivent être évaluées afin d’en limiter le traitement.
Language
  • French
Classification
Information, communication and media sciences
Notes
  • Haute école de gestion Genève
  • Information documentaire
  • hesso:hegge
License
License undefined
Identifiers
  • RERO DOC 329735
Persistent URL
https://sonar.ch/hesso/documents/314870
Statistics

Document views: 62 File downloads:
  • Daellenbach-M_moire-Vdef.pdf: 92