Helve'tweet : exploration d'un million de tweets géolocalisés en Suisse, février-août 2017

Motisi-Nagy, Agnes A ; Zuber-Dutoit, Tania ; Gaudinat, Arnaud (dir.)

(Travail de recherche réalisé dans le cadre du Master of Science HES-SO en Sciences de l'information à la Haute école de gestion de Genève (HEG-GE), Filière Information documentaire, 2018)

Réseau social utilisé activement par 8% de la population suisse1, Twitter permet à ses utilisateurs de géolocaliser leurs messages. Cette étude exploratoire quantitative, basée sur des messages géolocalisés en Suisse écrits entre le 18 février et le 31 août 2017, fait suite au projet GEoTweet consacré aux tweets genevois en 2014-2015. Elle se propose de répondre à trois questions de... Plus

Ajouter à la liste personnelle
    Résumé
    Réseau social utilisé activement par 8% de la population suisse1, Twitter permet à ses utilisateurs de géolocaliser leurs messages. Cette étude exploratoire quantitative, basée sur des messages géolocalisés en Suisse écrits entre le 18 février et le 31 août 2017, fait suite au projet GEoTweet consacré aux tweets genevois en 2014-2015. Elle se propose de répondre à trois questions de recherche pour évaluer les possibilités et les limites de l’utilisation des données fournies par l’API de Twitter lors des recherches sur la Suisse, dans les domaines de la sociologie des données et des sciences de l’information. Le focus est porté plus spécifiquement sur l’exploitation des données de géolocalisation, sur la problématique de l’identification des langues et sur les critères définissant un tweet suisse dans une perspective d’archivage. Après l’introduction et la revue de littérature, le rapport présente la méthodologie utilisée, les biais identifiés et les outils créés pour les mesurer, les éviter ou du moins les minimiser. Une concordance a ainsi été créée entre les place.id de Twitter et la liste officielle des communes suisses pour pallier au caractère non vérifié (en partie obsolètes, en partie erronées) des données géographiques fournies par Twitter. Trois séries de tests ont également été menés pour vérifier la fiabilité de l’algorithme de reconnaissance de langue de Twitter pour l’échantillon. Ils montrent une marge d’erreur de 4,25% sur les grandes langues européennes, mais qui peut monter jusqu’à 92% pour une langue « exotique » comme l’indonésien. Les analyses des tweets et des twittos ont permis de dégager des résultats importants. D’une part, elles montrent les fortes variations de leur nombre et de leur diversité linguistique à travers l’espace et le temps (p.ex. plus de comptes actifs en Suisse alémanique, mais plus de tweets en français dans l’ensemble ; plus de tweets pendant les périodes de vacances, mais baisse de la proportion des tweets et des twittos en langues nationales et en anglais). D’autre part la durée et l’étendue géographique de leur activité sont très variables (p.ex. 82% des comptes avec moins de 10 tweets, 68% actifs pendant un seul mois et 71% dans un seul canton). Des hypothèses ont été formulées et vérifiées pour expliquer ces résultats qui relèvent de la propension élevée des germanophones à twitter en anglais et de l’effet positif des loisirs sur l’envie et l’opportunité de twitter avec géolocalisation. Dans la dernière partie, l’étude propose des pistes afin d’établir des critères pour reconnaître un tweet suisse, en se basant sur les analyses menées préalablement ainsi que sur les expériences menées dans d’autres pays du monde. Le contexte international et suisse de l’archivage des tweets est abordé, sans prétention de vouloir proposer une méthode, au vu de la complexité des enjeux sociologiques, techniques et légaux.