Affiner les résultats

Type de document

Institution

Langue

Consortium of Swiss Academic Libraries

Simple and efficient classification scheme based on specific vocabulary

Savoy, Jacques ; Zubaryeva, Olena

In: Computational Management Science, 2012, vol. 9, no. 3, p. 401-415

Consortium of Swiss Academic Libraries

Searching strategies for the Bulgarian language

Savoy, Jacques

In: Information Retrieval, 2007, vol. 10, no. 6, p. 509-529

Université de Neuchâtel

Catégorisation de documents : applications en attribution d’auteur et analyse stylistique

Savoy, Jacques

In: Le Document ? Actes du 20e Colloque International sur le Document numérique (CiDE.20), 2017, p. 1-14

La catégorisation de documents (attribution d'un texte à une ou plusieurs catégories prédéfinies) représente un problème possédant de multiples facettes. Ainsi, l'indexation automatique correspond à l'une d'entre elles qui se fonde sur la sémantique des documents. Cependant d'autres applications analysent les mots­ outils, ces formes qui ne portent que peu ou pas de sens. Or ces...

Consortium of Swiss Academic Libraries

Comparative evaluation of term selection functions for authorship attribution

Savoy, Jacques

In: Digital Scholarship in the Humanities, 2015, vol. 30, no. 2, p. 246-261

Université de Neuchâtel

Information retrieval with Hindi, Bengali, and Marathi languages : evaluation and analysis

Savoy, Jacques ; Akasereh, Mitra ; Dolamic, Ljiljana

In: Multilingual Information Access in South Asian Languages, 2013, p. 334-352

Our first objective in participating in FIRE evaluation campaigns is to analyze the retrieval effectiveness of various indexing and search strategies when dealing with corpora written in Hindi, Bengali and Marathi languages. As a second goal, we have developed new and more aggressive stemming strategies for both Marathi and Hindi languages during this second campaign. We have compared their...

Université de Neuchâtel

Ad hoc retrieval with Marathi language

Akasereh, Mitra ; Savoy, Jacques

In: Multilingual Information Access in South Asian Languages, 2013, p. 23-37

Our goal in participating in FIRE 2011 evaluation campaign is to analyse and evaluate the retrieval effectiveness of our implemented retrieval system when using Marathi language. We have developed a light and an aggressive stemmer for this language as well as a stopword list. In our experiment seven different IR models (language model, DFR-PL2, DFR-PB2, DFR-GL2, DFR-I(n e)C2,...

Université de Neuchâtel

Cultural Heritage in CLEF (CHiC)

Petras, Vivien ; Bogers, Toine ; Toms, Elaine ; Hall, Mark ; Savoy, Jacques ; Malak, Piotr ; Pawłowski, Adam ; Ferro, Nicola ; Masiero Ivano

In: Information Access Evaluation. Multilinguality, Multimodality, and Visualization, 2013, vol. 8138, p. 192-211

The Cultural Heritage in CLEF 2013 lab comprised three tasks: multilingual ad-hoc retrieval and semantic enrichment in 13 languages (Dutch, English, German, Greek, Finnish, French, Hungarian, Italian, Norwegian, Polish, Slovenian, Spanish, and Swedish), Polish ad-hoc retrieval and the interactive task, which studied user behavior via log analysis and questionnaires. For the multilingual and...

Université de Neuchâtel

La voix du Président américain (1934-2014)

Savoy, Jacques

In: Actes 12e Journées internationales d’analyse statistique des données textuelles JADT 2014, 2014, p. 593-604

Dans cette communication, nous présentons une analyse lexicale d’un corpus composé des discours sur l’état de l’Union de 1934 à 2014. Ce corpus couvre environ 80 ans de vie gouvernementale américaine avec les allocutions tenues par treize présidents. Cette étude indique que les lemmes les plus fréquents n’apportent pas d’information très pertinente. Par contre, en observant la...

Université de Neuchâtel

Classification automatique d’opinions dans la blogosphère

Savoy, Jacques ; Zubaryeva, Olena

In: Actes 10e Journées Analyse statistique des Données Textuelles JADT 2010, 2010, p. 653-664

Cette communication traite de la classification automatique opinions dans la blogosphère. Sur la base d'une liste de phrases jugées pertinentes, le système doit déterminer si elles contiennent une opinion ou non. Afin d’atteindre ce but, plusieurs représentations et modèles de catégorisation peuvent être utilisés. Comme système de référence, nous avons retenu une classification...

Université de Neuchâtel

Lexical Analysis of US Political Speeches

Savoy, Jacques

In: Journal of Quantitative Linguistics, 2010, vol. 17, no. 2, p. 123-141

This article describes a US political corpus comprising 245 speeches given by senators John McCain and Barack Obama during the years 2007–2008. We present the main characteristics of this collection and compare the common English words most frequently used by these political leaders with ordinary usage (Brown corpus). We then discuss and compare certain metrics capable of extracting terms best...