Faculté informatique et communications IC, Section d'informatique, Institut des systèmes informatiques et multimédias ISIM

Cognitive language engineering towards robust human-computer interaction

Pallotta, Vincenzo ; Coray, Giovanni (Dir.)

Thèse sciences Ecole polytechnique fédérale de Lausanne EPFL : 2002 ; no 2630.

Ajouter à la liste personnelle
    Summary
    Intelligent information processing seems to be one of the most challenging task among those involved in human-computer interaction. A central issue is how to model the various types of interaction among artificial and natural entities at different levels of abstraction. On the one hand, models of interaction are required to better understand the communication phenomena. On the other, suitable languages and paradigms should provide powerful frameworks for developing computer-based applications. In this dissertation I focus on different aspects of the second problem, trying to develop a methodology for the design of interactive natural language applications (e.g. from question-answering to mixed-initiative dialogue). One of the main aspects I am concerned with in this work is the problem of their robustness. Several methods have been proposed for achieving robustness in natural language understanding, but these methods are sometimes hard to scale up or re-use in different applications. Moreover, they often concentrate on a single linguistic level of the processing rather than offering a global solution. I will set up a Language Engineering environment whose goal is to combine software engineering and cognitive aspects (e.g. aspects related to representation of a mental model of the speaker). Given its complexity, it is apparent that the problem can be solved only partially. I want to stress here that the main contribution of my work is a holistic perspective on the problem of natural language understanding. Rather than focusing on a particular aspect of natural language processing, I tried to benefit from the big amount of work that has been already done in Computational Linguistics and Computer Science merging different ideas and techniques. In the first part of the dissertation I explore the universe of Language Engineering in order to clarify how my contribution can be situated. After a survey on the state of the art on robust methods in analysis of natural language data, I focus on the role that Computational Logic plays in relating the syntactic and semantic analysis of natural language to its practical understanding within specific applications. Robustness is considered from two complementary perspectives, borrowing the terminology from modern software engineering: robustness "in the small" and robustness "in the large". The first perspective is discussed while presenting an application for the Interaction through Speech with Information Systems, where robust semantic parsing is used to extract queries from spoken natural language utterances.The second perspective is examplified by the re-engineering of an existing text analysis system using a new Language Engineering methodology: Agent-Oriented Language Engineering. In the second part of the thesis I discuss how cognitive aspects can be integrated into a Language Engineering environment leading to the notion of Cognitive Language Enginering. I tackle the difficult problem of robust dialogue management from both a cognitive and computational perspective. I propose two frameworks for the semantic representation and assimilation of information into the dialogue information state. The first framework allows us to represent and reason about the dynamic aspects of objects and events. The second framework is centered on the notion of mental space and it is used to build representations of the cognitive processing of information during communication.
    Riassunto
    Riassunto Il trattamento intelligente dell'informazione sembra essere uno degli aspetti più stimolanti tra quelli legati all'interazione tra l'uomo e la macchina. Una questione di centrale importanza è la modellazione di vari tipi di interazione tra entità naturali e artificiali a differenti livelli di astrazione. Da una parte, sono richiesti dei modelli di interazione per meglio comprendere il fenomeno comunicativo. Dall'altra, dei linguaggi e dei paradigmi appropriati dovrebbero assicurare degli ambienti di sviluppo di applicazioni computazionali particolarmente raffinati e potenti. In questa dissertazione mi sono concentrato sui vari aspetti legati al secondo problema, cercando di sviluppare una linea metodologica per la progetazione di applicazioni interattive basate sull'uso del linguaggio naturale, come ad esempio, i sistemi di domanda-risposta e i sistemi di dialogo a iniziativa mista. Uno degli aspetti fondamentali su cui ho prestato particolare attenzione è il problema della robustezza. Pur essendo stati proposti svariati metodi per raggiungere tale obiettivo, questi metodi sono spesso difficili da portare su larga scala o da riutilizzare in altre applicazioni. Inoltre, tali metodi sono adatti a trattare un singolo livello linguistico e non offrono una soluzione globale. Si propone quindi un ambiente per il Language Engeneering il cui obiettivo è quello di conciliare sia aspetti di software engineering che aspetti di tipo cognitivo, come per esempio la rappresentazione del modello mentale del parlante nel contesto di un dialogo. Data l'evidente complessità, risulta chiaro che il problema può essere risolto soltanto in misura parziale. Mi sembra opportuno evidenziare a questo punto, che il contributo maggiore del mio lavoro è dato da una prospettiva olistica nei confronti del problema della comprensione del linguaggio naturale. Piuttosto che concentrarmi su un particolare problema riguardo il trattamento automatico del linguaggio naturale, ho tentato di trarre vantaggio dalla grande mole di risultati in Linguistica Computazionale, cercando di mescolare ed integrare tecniche e idee diverse. Nella prima parte della tesi, si esplora l'universo del Language Engineering con il fine di meglio situare il mio contributo. Dopo una rassegna sullo stato dell'arte circa i metodi robusti per l'analisi del linguaggio naturale, mi concentro sul ruolo importante che la Logica Computazionale riveste nell'integrare l'analisi sintattica e semantica per raggiungere l'obiettivo della comprensione del linguaggio naturale in applicazioni specifiche. Il concetto di robustezza viene quindi considerato da due prospettive complementari. Prendendo in prestito la terminologia della moderna ingegneria del software, si considera la robustezza "in the small" e la robustezza "in the large". La prima prospettiva è analizzata mediante la presentazione di una particolare applicazione per l'accesso vocale a un sistema informativo, in cui la tecnica di parsing semantico robusto è stata adottata per l'estrazione di richieste (verso basi di dati) da enunciati in linguaggio naturale parlato. La seconda prospettiva è esemplificata attraverso la reingegnerizzazione di un'applicazione esistente per l'analisi del testo, facendo uso di una nuova metodologia per il Language Engineering: Agent-Oriented Language Engineering. Nella seconda parte della tesi, si discute dell'integrazione degli aspetti cognitivi nel Language Engineering, fino ad arrivare alla formulazione della nozione di Cognitive Language Engineering. Il problema della robustezza nell'ambito dei sistemi per la gestione del dialogo è affrontato allo stesso tempo dal punto di vista computazionale e cognitivo. Verranno dunque proposti due modelli per la rappresentazione semantica dell'informazione e la sua conseguente assimilazione nello stato informazionale del dialogo. Il primo modello proposto permette di rappresentare gli aspetti dinamici degli oggetti e degli eventi sui quali è possibile effettuare il ragionamento computazionale. Il secondo modello è incentrato sulla nozione di spazio mentale ed è utilizzato per costruire le rappresentazioni dei processi cognitivi legati al trattamento dell'informazione durante la comunicazione.