Université de Fribourg

Authorship attribution and profiling in Spanish and English language

Miculicich, Lesly ; Savoy, Jacques (Dir.)

Mémoire de master : Université de Fribourg, 2014.

The authorship attribution is the practice of inferring the author of a given text based on the analysis of her/his writing style. It has been largely used in literature work disputes but it has other interesting applications such as forensics and plagiarism detection. The purpose of this project is to experiment and present a solution that can identify the authors of a given corpora. We have two...

Université de Neuchâtel

Text clustering with styles

Kocher, MIrco ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2017.

Cette thèse présente le problème du regroupement d'auteurs formulé de la manière suivante : en partant d'un ensemble composé de n textes, le but est de déterminer le nombre k d'auteurs distincts, pour regrouper les textes en k classes. De manière itérative, nous construisons un système stable et simple qui est capable de regrouper automatiquement les documents selon...

Université de Neuchâtel

Multilingual and domain-specific IR : a case study in cultural heritage

Akasereh, Mitra ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2015.

Nowadays we can find data collections in many different languages and in different fields. So we are facing with a rising need for search systems handling multilinguality as well as professional search systems which allow their users to search in a specific field of knowledge. In this thesis we propose a search system for data on cultural heritage. Our data comes from different resources...

Université de Neuchâtel

Information retrieval of digitized medieval manuscripts

Naji, Nada ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2013.

This dissertation investigates the retrieval of noisy texts in general and digitized historical manuscripts in particular. The noise originates from several sources, these include imperfect text recognition (6% word error rate), spelling variation, non-standardized grammar, in addition to user-side confusion due to her/his limited knowledge of the underlying language and/or the searched text....

Université de Neuchâtel

Feature weighting approaches in sentiment analysis of short text

Kummer, Olena ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2012.

In this thesis, we propose a supervised classification scheme based on computation of the statistical scores for the textual features. More specifically, we consider binary classification (opinionated or factual, positive or negative) of the short text in the domains of movie reviews and newspaper articles. We analyze the performance of the proposed models on the corpora with the unequal sizes of...

Université de Neuchâtel

Influence of language morphological complexity on information retrieval

Dolamic, Ljiljana ; Savoy, Jacques (Dir.) ; Kropf, Peter (Codir.)

Thèse de doctorat : Université de Neuchâtel, 2010.

In this dissertation two aspects of information retrieval are elaborated. The frst involves the creation and evaluation of various linguistic tools for languages less studied than English, and in our case we have chosen to work with the two Slavic languages Czech and Russian, and three languages widely spoken on the Indian subcontinent, Hindi, Marathi and Bengali. To do so we compare various...

Université de Neuchâtel

Domain specific information retrieval social science, blogsphere and biomedicine

Fautsch, Claire ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2009 ; Th. 2122.

Aujourd'hui la recherche d'information est bien connue et utilisée dans le contexte des moteurs de recherche en ligne. Or la recherche d'information présente aussi beaucoup d'autres applications, tel que la recherche d'information dans les domaines spécifiques. Cette thèse résume nos travaux effectués dans ce champ en présentant une sélection de nos articles scientifiques. Dans ce travail...

Université de Neuchâtel

Recherche d'information plurilingue

Abdou, Samir ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2007 ; Th.1972.

Dans cette thèse, nous présentons nos investigations en recherche d’information selon deux contextes. Premièrement, nous nous sommes intéressés à l’aspect plurilingue de la Toile en abordant le développement de moteurs de recherche pour des langues présentant des caractéristiques visuelles, morphologiques et syntaxiques très différentes des langues indo-européennes. Plus...

Université de Neuchâtel

Extraction automatique d'information : génération de résumé et question-réponse

Perret, Laura ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2005 ; 1792.

Dans cette thèse, nous abordons diverses techniques d’extraction automatique d’information, à savoir la génération de résumé et la question-réponse. Dans la première partie, nous avons implémenté et évalué plusieurs méthodes de génération de résumé à partir d’articles médicaux. L’utilisation de la régression logistique s’est révélée produire les meilleurs...

Université de Neuchâtel

Recherche d'information bilingue et multilingue : amélioration de la traduction automatique et sélection de traducteur

Berger, Pierre-Yves ; Savoy, Jacques (Dir.)

Thèse de doctorat : Université de Neuchâtel, 2006 ; 1868.

Dans cette thèse, nous abordons différentes techniques visant à améliorer l'utilisation de la traduction automatique dans le contexte de la recherche d'information bilingue et multilingue. Nous avons quantifié la perte de performance liée à la traduction automatique de la requête d'une langue vers une autre. Pour diminuer cette perte d'efficacité, nous avons évalué six approches, à...