Le prochain séminaire de l’équipe Cornet aura lieu le 31 janvier 2024 à 11h35 en S3, et comportera deux parties.
Pour commencer, Felipe Albuquerque (LIA) présentera son sujet de thèse portant sur Le problème de la p-médiane avec contraintes de couverture : nouvelles méthodes de résolution et application à la conception de services publics.
Puis, Luca Dini and Pierre Jourlin présenteront leur travail en cours sur le thème des Hybrid Methods for Cognitive Attitudes Detection.
Résumé : dans ce séminaire, nous présenterons un travail en cours sur la transformation d’un système de repérage de mots-clés en un moteur d’étiquetage basé sur des concepts. Nous mettrons en évidence quatre axes majeurs de ce travail, à savoir :
- Le remplacement d’un mécanisme de repérage de mots-clés basé sur Google par SIDRES V2, un interpréteur CFG basé sur Rust.
- La création manuelle de grammaires de désambiguïsation, afin d’écarter les contextes où les occurrences de mots ne sont pas des indices d’un concept donné.
- La création de ressources supplémentaires par plusieurs techniques d’apprentissage automatique et de statistiques, telles que les embeddings de mots et l’extraction terminologique.
- Des mécanismes d’expansion basés sur la modélisation RDFS de concepts cognitifs et une expansion ultérieure via des graphes de données ouvertes liées, tels que Wikidata.