Soutenance d’HDR de Mohamed Morchid – 26 novembre 2019

25 novembre 2019

Le 26 novembre prochain à 16h en salle des thèses (campus Hannah Arendt). Cette HDR intitulée « Réseaux de Neurones pour le Traitement Automatique du Langage » sera présentée devant un jury composé de : Rapporteurs : Mme Dilek Z. HAKKANI-TÜR Senior Principal Scientist, Alexa AI, USA M. Patrice BELLOTProfesseur, AMU Polytech’, LIS, Marseille M. Frédéric ALEXANDREDirecteur de Recherche INRIA, Bordeaux Examinateurs : M. Yannick ESTÈVEProfesseur, AU, LIA, Avignon M. Frédéric BÉCHETProfesseur, AMU, LIS, Marseille

SpeechBrain

18 novembre 2019

        Nous sommes heureux d’annoncer le lancement de  (https://speechbrain.github.io/), un toolkit tout-en-un liant PyTorch et le traitement automatique de la parole. Basé sur le succès de son prototype PyTorch-Kaldi, nous souhaitons accroitre les fonctionnalités ainsi que l’efficacité de ce projet. Plus précisément, le but est de créer un outil unique, flexible et surtout facile à prendre en main, qui puisse être utiliser pour rapidement développer des systèmes état de l’art pour la parole. Nous connaissons tous, dans nos sous-domaines respectifs, de nombreux outils éparpillés, plus ou moins complexes (souvent plus que moins), et il est donc d’un intérêt certain de construire un projet unique, capable de réunir et de combler tous les besoins de la communauté. Quelques exemples sont: ASR (end-to-end et DNN-HMM), identification / vérification du locuteur, séparation de la parole, traitement de signaux multi-microphones, apprentissages “self-supervised” et non supervisé, extraction de caractéristiques via GPUs, et autres. Le projet sera dans un premier temps dirigé par le MILA (via Dr. Ravanelli Mirco, présent à la dernière retraite du LIA), et est actuellement soutenu par Samsung, Dolby ainsi que Nvidia. Le LIA participe également depuis le début à cet outil, via mon implication dans la création et gestion de PyTorch-Kaldi Plus d'infos

Evaluation de l’intelligibilité chez des patients atteints de troubles de la parole – Optimisation du protocole DAP automatique

4 novembre 2019

Stage Master Recherche – 6 mois Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr) Le terme « troubles de la parole » fait référence à l’ensemble des déficiences affectant la production de la parole chez un être humain. Le bégaiement est un exemple de troubles de la parole. Le LIA travaille depuis une dizaine d’années sur les troubles de la parole, et plus particulièrement sur la manière dont les outils de traitements automatiques peuvent aider les cliniciens et les phonéticiens dans leur analyse acoustico-phonétique du signal de parole et/ou perceptive des productions de parole en vue de mieux comprendre les dégradations inhérentes aux troubles de la parole. Les travaux les plus récents portent notamment sur l’étude d’un système de détection automatique de déviances dans des productions de parole dégradée [Laaridh et al., 2015] ou d’un système automatique de prédiction du degré d’intelligibilité basé sur des i-vecteurs [Laaridh et al., 2017 ; Laaridh et al., 2018]. Dans un premier temps, ces approches ont été appliquées sur des productions de parole dégradée produites par des patients atteints de lésions neurologiques localisées dans le système nerveux central ou périphérique. On parle alors de trouble moteur de la parole d’origine neurologique, désigné sous le terme de dysarthrie. Plus d'infos

Extraction d’informations dans fr.wikipedia

4 novembre 2019

Intitulé du stage Extraction d’informations dans fr.wikipedia Nom de la personne proposant le stage Pierre Jourlin Lieu du stage L.I.A Descriptif du stage : Le stage se situe dans le cadre d’un projet nommé ‘Les élus français dans Wikipédia’ qui sera soumis pour financement à la SFR Agorantic en octobre prochain par Pierre Jourlin (LIA) et Guillaume Marrel (LBNC).Dans le cadre d’une étude sociologique sur les « dictionnaires biographiques » des élu.e.s politiques français.e.s, nous disposons d’une version informatisée du Registre National des Élus (RNE) comme base nominative de référence : la totalité des candidats élus ou nommés sur le territoire national dans toutes les assemblées municipales, intercommunales, départementales, régionales, nationales et européenne, y sont recensés et caractérisés succinctement (nom, prénom, date de naissance, profession déclarée, nuance politique), soit environ 900000 personnes répartis sur plus de 500000 mandats, de 2001 à nos jours. Il s’agit de croiser cette base nominative avec Wikipédia pour extraire, lorsqu’elles sont disponibles, toutes les informations biographiques concernant ces élus. Dans certains cas, ces informations sont déjà structurées sous la forme d’infoboites. Certaines sont même déjà extraites sous forme de triplets RDF (Resource Description Framework, voir Web Sémantique et dbpedia) , donc facilement exploitables sous forme relationnelle. Le Plus d'infos