(Travail de recherche réalisé dans le cadre du Master of Science HES-SO en Sciences de l'information à la Haute école de gestion de Genève (HEG-GE), Filière Information documentaire, 2018)
Réseau social utilisé activement par 8% de la population suisse, Twitter permet à ses utilisateurs de géolocaliser leurs messages. Cette étude exploratoire quantitative, basée sur des messages géolocalisés en Suisse écrits entre le 18 février et le 31 août 2017, fait suite au projet GEoTweet consacré aux tweets genevois en 2014-2015. Elle se propose de répondre à trois questions de...
- TDIG 129
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
53
KINDER-KURLANDA, Katharina, WELLER, Katrin, ZENK-MÖLTGEN, Wolfgang, PFEFFER,
Jürgen et MORSTATTER, Fred, 2017....
- MORSTATTER, Fred, PFEFFER, Jürgen, LIU, Huan et CARLEY, Kathleen M., 2013....
- Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
61
Annexe 4 : Fichier de concordance
place.full_name.keyword: place.id.keyword:
Descending
Descending
Localité
(manuelle)
en bleu les
différences de
langue
Canton
Aadorf, Schweiz
d29b524faece2f23
Aadorf
Turgovie
4551
4551 Aadorf
8865
8355
709949
261089
Aarau, Schweiz
0e0b7f0796a22e3a
Aarau
Argovie
4001
4001 Aarau
21036
5000
646060
248866
Aarberg, Schweiz
9cee1db6d75d6bdf
Aarberg
Berne
Aarburg, Schweiz
79248c3b36c1d8ca
Aarburg
Argovie
Aarwangen, Schweiz
1e1380d77054dc92
Aarwangen
Berne
Abtwil, Schweiz
bd4bb780492064c5
Abtwil
Argovie
4221
Aclens, Suisse
fb185824833c049a
Aclens
Vaud
5621
Acquarossa, Svizzera
c3f8269d28ee180b
Acquarossa
Tessin
5048
Adelboden, Switzerland
e22405b0993ab18d
Adelboden
Berne
Adligenswil, Schweiz
1a4ff3d6a1b96e68
Adligenswil
Lucerne
Adlikon, Schweiz
d5d97a95855eaff0
Adlikon
Zurich
Adliswil, Schweiz
Aedermannsdorf,
Schweiz
04c60b5de694cc1f
Adliswil
Zurich
3f1b7a8ca1cc7f1e
Aedermannsdorf
Soleure
Aefligen, Schweiz
8f022a7eb6e80ed5
Aefligen
Berne
401
Aegerten, Schweiz
2fa825a85251e634
Aegerten
Aesch (BL), Schweiz
1067fd7acdcc5620
Aesch (BL)
Berne
BâleCampagne
Aesch (LU), Schweiz
34368e9fd53b5398
Aesch (LU)
Lucerne
Aesch (ZH), Schweiz
4375b927b81ee644
Aesch (ZH)
Zurich
Aeschi (SO), Schweiz
Aeschi bei Spiez,
Schweiz
f4ba724a1a8b4ab5
Aeschi (SO)
Soleure
4aa96e844c378b2e
Aeschi bei Spiez
Berne
Aetigkofen, Schweiz
adff40d6c258c4dc
Aetigkofen
Soleure
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
no OFS
No OFS
Nom communes Population code postal coordonnée coordonnée
communes communes actuelles
résidente
Cadastre.ch Est
Nord
liste
actuelles
2016
historisée
301
301 Aarberg
4527
3270
587587
210292
4271
4271 Aarburg
7854
4663
634825
241201
4518
4912
624590
232268
4221 Abtwil
997
5646
669471
225299
5621 Aclens
521
1123
528792
157797
5048 Acquarossa
1850
6716
715114
146055
561
561 Adelboden
3370
3715
609227
149073
1051
1051 Adligenswil
5352
6043
670369
213699
21
21 Adlikon
666
8452
694409
270774
131
131 Adliswil
18742
8134
681938
240784
556
4714
612829
239205
401 Aefligen
1089
3426
608588
216085
731
731 Aegerten
2011
2558
588846
218917
2761
2761 Aesch (BL)
10184
4147
611908
257353
1021
1021 Aesch (LU)
1141
6287
660592
234064
241
241 Aesch (ZH)
1275
8904
675546
243425
2511
2511 Aeschi (SO)
1213
4556
617223
225346
2232
3703
619578
167663
2532
4583
602128
219137
321
2421
562
2441
321 Aarwangen
2421 Aedermannsdorf
562 Aeschi bei Spiez
2465 Buchegg
62
Annexe 5 : Tests de langues
Tableau 8 : Langues détectées par Twitter dans l’échantillon du test (TL1)
Nombre de tweets
Nombre de
fausse détection
Proportion de fausse
détection
Nl : hollandais
25
25
100%
In : indonésien
13
13
100%
Ht : créol
4
4
100%
Cy : gallois
3
3
100%
Et : estonien
3
3
100%
Da : danois
2
2
100%
Fi : finnois
2
2
100%
Pl : polonais
2
2
100%
Cs : tchèque
1
1
100%
Tl : tagalog
3
1
33%
Sl : slovène
4
1
25%
En : anglais
293
47
16%
De : allemand
82
12
15%
Es : espagnol
50
5
10%
Fr : français
132
11
8%
Pt : portugais
60
5
8%
Und : indéterminé
130
7
5%
It : Italien
66
3
5%
Ar : arabe
91
0
0%
Tr : turque
18
0
0%
Ja : japonais
5
0
0%
Pa : panjabi
3
0
0%
Ru : russe
3
0
0%
Sv : suédois
2
0
0%
Th : thailandais
2
0
0%
Ta : tamoul
1
0
0%
Langue détectée
par twitter
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
63
Figure 29 : Réattribution des langues "in" (TL2)
1%
2% 2%
3%
4%
8%
25%
igbo (Nigéria)
shona (bantou)
xhosa (Afrique australe)
anglais
allemand
10%
indonésien ou tagalog
arabe
hindi
und
24%
21%
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
tagalog (philippine)
64
Annexe 6 : Listes des user.lang et des source.lang de notre
échantillon
Proportion
des
comptes
Nb
de
comptes
en
50,81%
de
Nb
des
tweets
Source.lang
proportion
des tweets
33’218
en
35,909%
373’385
14,86%
9’718
fr
15,958%
165’932
fr
13,15%
8’597
de
13,923%
144’775
es
5,53%
3’618
und
11,399%
118’524
it
4,59%
3’001
es
4,210%
43’772
pt
2,01%
1’317
pt
3,282%
34’131
ar
1,73%
1’128
it
2,747%
28’560
tr
1,29%
845
ar
2,544%
26’448
en-gb
1,25%
814
tr
2,124%
22’086
nl
1,06%
694
ja
1,277%
13’276
ja
0,92%
603
in
1,145%
11’906
ru
0,79%
519
nl
0,806%
8’382
id
0,26%
171
ru
0,711%
7’396
sv
0,20%
129
tl
0,495%
5’145
ca
0,18%
117
th
0,432%
4’488
pl
0,16%
106
sv
0,425%
4’420
th
0,16%
105
et
0,305%
3’168
fi
0,13%
88
ht
0,298%
3’097
zh-cn
0,13%
85
fi
0,256%
2’657
ko
0,11%
72
da
0,255%
2’649
cs
0,10%
67
ko
0,198%
2’059
da
0,07%
43
pl
0,196%
2’036
el
0,06%
40
ro
0,159%
1’654
hu
0,06%
38
sl
0,134%
1’390
no
0,05%
32
no
0,122%
1’269
sr
0,04%
29
cy
0,109%
1’137
ro
0,04%
25
cs
0,078%
807
zh-tw
0,03%
21
hi
0,068%
704
hr
0,03%
20
lt
0,058%
601
he
0,03%
17
eu
0,051%
527
zh-Hans
0,02%
14
hu
0,048%
503
uk
0,02%
13
is
0,040%
419
sk
0,02%
11
zh
0,040%
411
bg
0,01%
8
el
0,037%
388
fa
0,01%
7
lv
0,035%
362
User.lang
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
65
gl
0,01%
7
fa
0,033%
339
pt-PT
0,01%
7
sr
0,019%
194
lv
0,01%
4
uk
0,013%
136
msa
0,01%
4
iw
0,013%
132
fil
0,005%
3
vi
0,012%
129
es-MX
0,005%
3
ne
0,012%
121
fr-CA
0,003%
2
bg
0,011%
117
xx-lc
0,003%
2
ur
0,008%
82
vi
0,003%
2
ta
0,004%
46
eu
0,003%
2
si
0,002%
19
de-CH
0,002%
1
dv
0,001%
8
sq
0,002%
1
ps
0,001%
7
bn
0,002%
1
bo
0,0005%
5
sr-Latn
0,002%
1
am
0,0005%
5
nb
0,002%
1
pa
0,0005%
5
en-AU
0,002%
1
ka
0,0003%
3
fr-CH
0,002%
1
mr
0,0002%
2
ta
0,002%
1
ml
0,0001%
1
hi
0,002%
1
ckb
0,0001%
1
mk
0,002%
1
or
0,0001%
1
gsw
0,002%
1
my
0,0001%
1
ga
0,002%
1
bn
0,0001%
1
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
66
Annexe 7 : Répartition des tweets et twittos par canton
Tableau 9 : Répartition de la population résidente de plus de 15 ans (2016) par
canton, comparée à la proportion des tweets et des twittos
% population
résidente
% twittos
AG, Argovie
7.83%
3.10%
3.21%
AI, Appenzell-Intérieur
0.19%
0.20%
0.12%
AR, Appenzell-Extérieur
0.65%
0.20%
0.14%
BE, Berne
12.26%
11.93%
8.92%
BL, Bâle-Campagne
3.41%
1.39%
1.20%
BS, Bâle-Ville
2.33%
2.95%
4.06%
FR, Fribourg
3.62%
3.37%
2.03%
GE, Genève
5.75%
13.96%
19.65%
GL, Glaris
0.48%
0.26%
0.07%
GR, Grisons
2.39%
3.74%
1.80%
JU, Jura
0.86%
0.40%
0.28%
LU, Lucerne
4.77%
4.00%
3.52%
NE, Neuchâtel
2.10%
1.36%
1.88%
NW, Nidwald
0.51%
0.69%
0.37%
OW, Obwald
0.44%
1.96%
3.22%
SG, St-Gall
5.94%
2.53%
2.54%
SH, Schaffhouse
0.97%
0.63%
0.55%
SO, Soleure
3.22%
0.97%
1.50%
Sz, Schwytz
1.85%
1.51%
0.44%
TG, Turgovie
3.20%
1.14%
0.79%
TI, Tessin
4.27%
5.22%
3.62%
UR, Uri
0.43%
0.63%
0.17%
VD, Vaud
9.18%
11.50%
13.25%
VS, Valais
4.03%
5.66%
4.70%
ZG, Zoug
1.46%
1.01%
1.04%
ZH, Zurich
17.85%
18.30%
18.69%
Cantons
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
% tweets
67
Annexe 8 : Tableaux des répartitions mensuelles des
tweets, sans et avec correction des valeurs
Tableau 10 : Répartition temporelle des tweets par mois sans correction des valeurs
Période
Février
jours
192
moyenne
Avril
11
31
30
28
30
31
31
5416
5’414
5328
5023
5104
5335
5411
6248
médiane
5386
5’471
5375
4981
5277
5325
5423
6385
min
800
4’836
800*
4536
2289
4656
4728
4577
max
7721
5’577
6’848
5700
6391
6057
6291
7721
écart type
742
270
999
310
870
351
415
664
écart
moyen
494
196
536
255
560
282
329
529
1039819
59’551
165180
150676
142919
160062
167739
193692
Total
Mai
Juin
Juillet
Août
Mars
Tableau 11 : Répartition temporelle des tweets par mois après correction des valeurs
Période
Février
Mars
Avril
Mai
Juin
Juillet
Août
jours
195
11
31
30
31
30
31
31
moyenne
5471
5414
5479
5023
5334
5335
5411
6248
médiane
5386
5471
5401
4981
5217
5325
5423
6385
min
4307
4836
4307
4536
4779
4656
4728
4577
max
7721
5577
6848
5700
6391
6057
6291
7721
écart type
577
269.9
539
310
378
351
415
664
écart
moyen
438
195.9
391
255
273
282
329
529
169862
150676
165347
160062
167739
193692
total
1066929
59551
Helve’tweet
MOTISI-NAGY Agnes-Anna et ZUBER-DUTOIT Tania
68
Petites questions et réponses
Durant notre recherche, nous avons trouvé des anomalies, ou cherché la réponse à
certaines questions....
|