Soutenance de Thèse – 11/12/2025 – Nicolas André

4 décembre 2025

Titre : « Représentations et fonctions d’activation réelles et hyper-complexes dans les réseaux de neurones pour le traitement du signal ». Date: jeudi 11 décembre 2025 à 8h Lieu : salle des thèses de l’Université d’Avignon, campus Hannah Arendt. Résumé: Ce manuscrit de thèse porte sur des problématiques d’intelligence artificielle (IA) et plus spécifiquement, sur les réseaux de neurones artificiels. Ces réseaux de neurones sont des modèles mathématiques centrales dans les processus modernes d’IA, se complexifiant à mesure que les tâches pour lesquelles ces réseaux sont utilisés se diversifient et se démocratisent. L’usage moderne de ces réseaux de neurones, appliqués à des tâches de langage, a donné naissance aux Large Modèles de Langage (LLM). Ces modèles peuvent comporter des milliards de paramètres, posant ainsi des questions de sobriété et d’économie de moyens. La première partie de ce manuscrit consiste en un état de l’art concernant les architectures de réseaux de neurones réels (réels ici caractérise le domaine mathématique dans lequel on opère, l’ensemble des nombres réels), les réseaux de neurones de quaternions et les fonctions d’activation. Les différentes architectures neuronales et notions mathématiques employées par la suite y sont décrites. La seconde partie présente les différentes solutions aux problématiques soulevées lors de Plus d'infos

Offre de stage: Restauration de la parole pathologique à base d’apprentissage profond

3 décembre 2025

Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr) Durée : de 3 à 6 mois Titre : Restauration de la parole pathologique à base d’apprentissage profond Descriptif : Bien que les modes de communication aient largement évolué depuis une vingtaine d’années avec
l’ère du numérique, pouvant se substituer dans de nombreuses situations à la parole – messagerie
électronique, réseaux sociaux, blogs, messageries instantanées… la parole reste indispensable pour
une bonne intégration dans notre société. La communication orale permet de partager avec les
autres, que ce soit dans le monde professionnel ou la vie de tous les jours : partager pour exprimer 
une demande, pour informer, pour conseiller, pour débattre, pour convaincre, pour enseigner, pour
 divertir, pour exprimer un sentiment, … pour vivre en société.
 La démocratisation de la téléphonie mobile, des réseaux de communication, des logiciels de
visioconférences et de l’accès à Internet fait que nous pouvons communiquer oralement partout
 avec tous nos contacts professionnels ou personnels, quelle que soit leur localisation géographique.
 Aussi, au vu de l’importance de la communication orale, perdre la parole ou le langage peut être 
ressenti comme une perte d’humanité. 
Les troubles de la communication sont définis par The American Speech and Hearing Association
 de la manière suivante : « An impairment in the ability to Plus d'infos

Soutenance de thèse – Yannis Labrak – 15/09/2025

11 septembre 2025

Titre: Les Modèles de Langage au Carrefour du Texte et de la Parole pour les Applications de Santé La soutenance est publique et se tiendra le lundi 15 septembre 2025 à 14h00, à l’Université d’Avignon – Amphithéâtre Blaise (CERI, 339 Chem. des Meinajaries, 84000 Avignon). Elle se déroulera en anglais. Une participation à distance est également possible en utilisant le lien ZOOM suivant:https://us05web.zoom.us/j/86181938873?pwd=zPYei9eeLAIIG6eFT0hL96K6ameR3H.1 (passcode is « 1212121212 ») Jury: Co-directeurs de thèse: Mickael Rouvier, Maître de conférences HDR, LIA – Université d’AvignonRichard Dufour, Professeur, LS2N – Université de Nantes Membres du Jury: Asma Ben Abacha, Chercheuse senior – Microsoft Health AIElena V. Epure, Chercheuse senior – Deezer ResearchLaurent Besacier, Chercheur principal – Naver Labs EuropePierre Zweigenbaum, Directeur de recherche – LISN, CNRSPhilippe Langlais, Professeur – DIRO, Université de Montréal Membre invité: Julien Nave, Directeur R&D – Zenidoc Résumé: Le domaine médical présente des défis uniques en matière de traitement du langage à travers sa terminologie spécialisée, ses réglementations strictes sur les données et ses besoins critiques en information. Avec la démocratisation des modèles de langage pour assister les professionnels de santé dans leur quotidien, leur adaptation aux domaines d’application est devenue nécessaire pour faciliter leur accessibilité à un public plus large, à différentes langues et Plus d'infos

Séminaire SLG – Ismail Mohsine -12/06/2025

27 mai 2025

Le 12 juin à 12h, nous aurons le plaisir d’accueillir une présentation du Dr Ismail Mohsine, spécialiste en hydroinformatique, actuellement en séjour au LIA. La présentation se tiendra en salle S6.Veuillez trouver ci-dessous le résumé du séminaire ainsi qu’une courte biographie du Dr Ismail Mohsine. ==================================== Bio Ismail Mohsine est docteur en sciences de la Terre, spécialiste en hydroinformatique. Formé au laboratoire LG2E (Faculté des Sciences de Rabat), en partenariat avec l’Université d’Avignon et l’IRD, il mène des recherches intégrant géosciences, intelligence artificielle et modélisation environnementale appliquées au domaine des ressources en eau. Résumé Dans un contexte de changement climatique et de pression croissante sur les ressources en eau, la prévision des niveaux piézométriques devient un enjeu majeur pour la gestion durable des aquifères. Cette présentation propose une approche de prédiction basée sur des réseaux de neurones récurrents (type LSTM), appliquée à des séries temporelles multivariées combinant données in situ, satellitaires (NDVI, température, précipitations, évapotranspiration …). Entraînés à l’échelle des unités hydrogéologiques, ces modèles tirent parti de la dynamique temporelle et des variations géographiques des données, tout en intégrant des mécanismes explicites de gestion des valeurs manquantes. Cette méthodologie hybride permet de reconstruire les lacunes de mesure et d’anticiper l’évolution des nappes dans des contextes complexes, contribuant à une Plus d'infos

Soutenance de thèse – Jarod Duret – 27/03/2025

25 mars 2025

Titre: Traduction de la parole vers la parole expressive La soutenance aura lieu le jeudi 27 mars à 13h15 dans l’amphithéâtre Blaise situé dans le batiment du CERI. Cette soutenance se déroulera en français. Abstract :Cette thèse explore la préservation de l’expressivité dans la traduction automatique parole vers parole (speech-to-speech translation — S2ST), sans recours au texte en tant que représentation intermédiaire. L’objectif est de développer un système capable de transférer non seulement le contenu linguistique, mais également les caractéristiques émotionnelles et expressives de l’énoncé source vers la langue cible.L’approche développée s’articule autour de deux composantes. Premièrement, l’utilisation d’unités discrètes de parole, extraites de modèles auto-supervisés, permettant de capturer efficacement le contenu phonétique. Deuxièmement, un encodeur multilingue d’émotions, ayant pour objectif d’extraire des caractéristiques expressives indépendantes de la langue. Ces représentations sont ensuite intégrées dans le processus de synthèse vocale afin de conditionner la génération de celle-ci. Jury :Anthony Larcher, PR à LIUM, Le Mans Université, RapporteurDamien Lolive, PR à IRISA, Université de Vannes, RapporteurLoïc Barrault, Docteur à Meta AI, ExaminateurFethi Bougares, Docteur à Elyadata, ExaminateurMarie Tahon, PR à LIUM, Le Mans Université, ExaminatriceMarcely Zanon-Boito, Docteur à NAVER LABS EUROPE, ExaminatriceYannick Estève, PR à LIA, Avignon Université, Directeur de thèseTitouan Plus d'infos

Séminaire SLG – Yanis Labrak – 27/03/2025

17 mars 2025

La prochaine réunion de l’équipe SLG aura lieu le jeudi 27 Mars prochain, en salle S4 de 12h00 à 13h00. Title: Text-Speech Language Models with Improved Cross-Modal Transfer by Aligning Abstraction LevelsAbstract: Text-Speech Language Models (TSLMs), language models trained to jointly process and generate text and speech, aim to enable cross-modal knowledge transfer to overcome the scaling limitations of unimodal speech LMs. The predominant approach to TSLM training expands the vocabulary of a pre-trained text LM by appending new embeddings and linear projections for speech, followed by fine-tuning on speech data. We hypothesize that this method limits cross-modal transfer by neglecting feature compositionality, preventing text-learned functions from being fully leveraged at appropriate abstraction levels. To address this, we propose augmenting vocabulary expansion with modules that better align abstraction levels between speech and text across the model’s layers. Representation analyses and improved multimodal performance suggest that our method enhances cross-modal transfer, even surpassing or rivaling state-of-the-art TSLMs trained using orders of magnitude more compute.  

Contrat doctoral Agorantic 2025

31 janvier 2025

Une allocation doctorale 2025 pour le LIA a été attribuée à l’équipe SLG par la FR Agorantic . Le sujet proposé est disponible sur la plateforme adum.fr https://adum.fr/as/ed/proposition.pl?site=avignon : Les candidats et candidates intéressées doivent postuler sur la plateforme adum.fr. Mais, avant cela, il est fortement recommander de contacter les chercheurs et chercheuses qui proposent les sujets, afin d’en discuter avec eux et elles. Les auditions seront organisées par la FR Agorantic selon les modalités générales indiquées sur https://agorantic.univ-avignon.fr/en/thesis/. Elles auront lieu début juin, la date définitive sera communiqué aux candidats retenus par les encadrants.

Allocation doctorale LIA 2025

31 janvier 2025

L’allocation doctorale 2025 du LIA a été attribuée à l’équipe SLG. Plusieurs sujets vont été proposés, ils sont disponibles sur la plateforme adum.fr https://adum.fr/as/ed/proposition.pl?site=avignon : Les candidats et candidates intéressées doivent postuler sur la plateforme adum.fr. Mais, avant cela, il est fortement recommander de contacter les chercheurs et chercheuses qui proposent les sujets, afin d’en discuter avec eux et elles. Les auditions seront organisées par l’Ecole Doctorale 536 selon les modalités indiquées sur https://univ-avignon.fr/recherche/le-doctorat/je-souhaite-preparer-un-doctorat/. Elles auront lieu début juin, la date définitive sera communiqué aux candidats retenus par les encadrants.

Soutenance de thèse Thibault Bañeras-Roux – 17/01/2025

15 janvier 2025

Titre: Analyse et compréhension de l’évaluation des systèmes de reconnaissance automatique de la parole : vers des métriques intégrant la perception humaine Date: 17 janvier à 14h00Lieu: Amphithéâtre du bâtiment 34, LS2N, Campus Lombarderie, 2 chemin de laHoussinière 44000 Nantes. Cette soutenance se déroulera en français. Abstract : De nos jours, le taux d’erreur mot reste la métrique la plus utiliséepour évaluer les systèmes de reconnaissance automatique de la parole(RAP). Toutefois, cette métrique présente des limites en matière decorrélation avec la perception humaine et ne se concentre que sur lapréservation de l’orthographe. Dans cette thèse, nous proposons desmétriques alternatives qui peuvent évaluer l’orthographe, mais aussi lagrammaire, la sémantique ou la phonétique. Pour analyser la capacité de ces métriques à refléter la qualité destranscriptions du point de vue des utilisateurs, nous avons constitué unjeu de données nommé HATS, annoté par 143 sujets francophones. Chaqueannotateur a examiné 50 triplets, composés d’une transcription deréférence manuelle et de deux hypothèses issues de différents systèmesde RAP, afin de déterminer quelle hypothèse était, selon eux, la plusfidèle. En calculant le nombre de fois où une métrique est d’accord avec leschoix des annotateurs, on obtient une mesure de sa corrélation avec laperception humaine. Ce corpus permet ainsi Plus d'infos

Séminaire SLG – Ana Montalvo – 06/11/2024

4 novembre 2024

Titre : Exploring Short-Duration Spoken Language Recognition: Insights from CENATAV Date : 06/11/2024 11h00 Salle : S4 Résumé : This presentation will introduce the Advanced Technologies Application Center (CENATAV), outlining its core mission and research areas, with a focus on the work of its Voice Processing Group. We will discuss the challenges of conducting research with limited access to high-performance computing resources and large datasets, emphasizing our recent work on spoken language recognition in very short-duration audio signals. Langue : English

1 2 3 5