Soutenance de thèse – Lucas Maison – 25/10/2025

14 octobre 2025

Titre : Robustesse des modèles neuronaux pour le traitement automatique de la parole Résumé : La reconnaissance automatique de la parole est devenue un outil populaire avec de nombreuses applications ; elle sert également comme étape intermédiaire pour d’autres tâches liées à la parole, telles que la compréhension du langage parlé ou la synthèse vocale. En reconnaissance automatique de la parole, le signal vocal est d’abord émis par le locuteur, transmis à travers l’environnement, avant d’être capturé par un dispositif d’enregistrement et traité par un modèle d’apprentissage automatique. Cependant, chacune de ces étapes peut être source de variabilité et entraîner des erreurs de transcription, ce qui affecte la robustesse du système. Dans cette thèse, nous étudions divers facteurs influençant le traitement de la parole par les machines. Plus précisément, nous nous concentrons sur les modèles pré-entraînés en français et affinés pour la reconnaissance vocale. Nous commençons par présenter nos travaux sur la robustesse aux accents. À travers de nombreuses expériences, nous évaluons la résilience du modèle aux variations d’accents et explorons différentes façons de combler les écarts entre ces derniers. Nous examinons en particulier l’impact des proportions de voix accentuées dans l’ensemble d’apprentissage. En outre, nous présentons CEREALES, un nouvel Plus d'infos

Offre de Stage: Génération de textes simulant le mal-être psychologique par modèles de langage génératifs

2 octobre 2025

Informations générales Durée : 6 mois Début : à partir de janvier 2026, au plus tard février 2026 Lieu : Université d’Avignon – LIA – Campus Contexte et données De nombreux acteurs de la prévention (écoutants, médecins, travailleurs sociaux…) se trouvent confrontés à des personnes exprimant leur détresse ou un mal-être profond. Disposer d’outils simulant diverses formes d’expression du mal-être offrirait des outils précieux pour entraîner des professionnels, tester des dispositifs de détection, ou encore sensibiliser des tiers à ce type de situations. Grâce à l’essor des grands modèles de langage (LLM), il est désormais envisageable de créer des outils capables de générer automatiquement des exemples réalistes et diversifiés de discours de personnes en souffrance, tout en maîtrisant la confidentialité (solution offline). Données Les données utilisées dans le cadre de ce stage proviendront notamment du jeu de données Suicide and Depression Detection disponible sur Kaggle. Ce corpus, collecté en utilisant l’API Pushshift, contient plusieurs centaines de milliers de messages souvent authentiques exprimant détresse, souffrance ou idées suicidaires. Il constitue une ressource de référence pour les travaux récents en détection ou simulation de discours liés au mal-être psychologique. Objectif du stage L’objectif principal du stage sera de concevoir un prototype de Plus d'infos