
Les séminaires du LIA sont habituellement organisés tous les jeudis entre 13h00 et 14h30.
Ils sont ouverts en priorité aux membres et aux étudiants du CERI (Licence et Master), mais peuvent être également accessibles aux autres membres et étudiants de l'université d'Avignon (sur demande).
D'autres événements, comme par exemple des soutenances de thèse, peuvent aussi être programmés.
Une liste de diffusion est à votre disposition pour recevoir les annonces des seminaires du LIA (inscription sur demande auprès des contacts ci-dessous).
Contact pour les "jeudis du LIA": Yézékaël Hayel - Corinne Fredouille
Consulter le recueil des résumés: 2005 | 2006 | 2007 | 2008
ainsi que le Mini-guide pour la préparation des séminaires.
Vous pouvez aussi voir la liste de tous les événements du mois ici.
Les contenus encyclopédiques tels que ceux de Wikipédia représentent aujourd’hui des masses considérables d’informations textuelles et multilingues sur la culture, la langue, les concepts ou les idées. Ces corpus encyclopédiques hautement structurés, en évolution permanente et aisément accessibles, ont favorisé l’apparition récente de systèmes ontologiques tels que DBpedia ou Yago. Ces systèmes exploitent les contenus encyclopédiques pour structurer des informations sémantiques. Pour introduire notre présentation, nous expliquerons tout d’abord pourquoi nous pensons que ces nouvelles familles d’ontologies pourraient jouer un rôle important dans des applications telles que l’extraction d’information, la recherche d’information, la recherche en langue naturelle et plus généralement le web sémantique. Puis nous présenterons le système d’extraction d’informations NLGbAse, que nous avons développé. Ce système permet de construire d’après 5 versions linguistiques de Wikipedia, un jeu de métadonnées composé de 3 422 975 entités de type personne, produit, organisation ou lieu, associées à des informations de nature statistiques et sémantiques. Nous décrirons ensuite l’ensemble d’algorithmes que nous avons mis au point pour exploiter les informations de cette base dans des applications de traitement et d'analyse. Nous indiquerons comment nous avons exploité les métadonnées de NLGbAse dans des applications d’étiquetage d’entités nommées, de recherche et d’extraction d’information et présenterons les résultats obtenus. En conclusion, nous décrirons les perspectives de développement de ce système et comment nous envisageons de l’utiliser en tant que coeur d’un système de Génération Automatique de Texte novateur, combinant informations extraites depuis ces métadonnées et graphes textuels.