Vous êtes ici

Accueil

Soutenance de la thèse intitulée
"Extraction automatique de segments textuels, détection de rôles, de
sujets et de polarités", par Remi Lavalley
effectuée dans le cadre d'un contrat CIFRE entre EDF et le LIA.

Celle-ci se tiendra le 9 juillet 2012 à 14h00 (pendant les jurys de Master, désolé) dans l'amphithéâtre Blaise Pascal du Centre d'Enseignement et de Recherche en Informatique (CERI) de l'Université d'Avignon et des Pays de Vaucluse (339, chemin des Meinajaries-Agroparc BP 91228-84911 AVIGNON Cedex 9-FRANCE).

Vous êtes également les bienvenus au pot de thèse qui suivra la soutenance.

Le jury sera composé de :
 M. Horacio Saggion, Professeur, DICT, Barcelone - Rapporteur
 M. Jacques Savoy, Professeur, IIUN, Neuchâtel - Rapporteur
 M. Mathieu Roche, Maître de Conférences HDR, LIRMM, Montpellier -
Examinateur
 M. Patrice Bellot, Professeur, LSIS, Marseille - Directeur de thèse
 Mme Chloé Clavel, Ingénieur Chercheur, EDF R&D, Clamart - Directrice
de thèse
 M. Marc El-Bèze, Professeur, LIA, Avignon - Directeur de thèse
    

Résumé :

Dans cette thèse, nous présentons de nouvelles méthodes permettant
l'extraction de chaînes de mots (segments textuels) relatives à des
catégories (thématiques, rôles des locuteurs, opinions). Nous proposons,
dans un premier temps, une méthode basée sur une métrique de recherche
de collocations, que nous appliquons de manière distincte sur les
documents liés à la même catégorie et qui, par itérations, nous permet
d'obtenir des chaînes caractéristiques de cette catégorie. Ces chaînes
sont alors employées pour améliorer les performances de systèmes de
catégorisation de textes ou dans un but d'extraction de connaissances
(faire ressortir des éléments textuels tels que des expressions
employées par un type de locuteurs, des sous-thématiques liées à la
catégorie, des jugements ou remarques fréquemment formulés, etc.).
Nous proposons ensuite une seconde méthode permettant de rechercher,
dans un corpus d'opinions, des n-grammes exprimant des jugements sur des
sujets prédéfinis. Nous pouvons alors extraire des segments textuels
représentant l'expression d'une opinion sur un des sujets cibles.

Ces méthodes sont validées par un certain nombre d'expériences
effectuées dans des contextes différents : écrits de blogs,
transcriptions manuelles de parole spontanée, critiques de produits
culturels, enquêtes de satisfaction EDF, en français ou en anglais, ...

Jeudi, 5 Juillet, 2012