mars 2026 – Laboratoire Informatique d’Avignon

Séminaire SLG – Matthew Wiesner – 26/03/2026

26 mars 2026

Salle 5 – 12h00 Titre: Modélisation Extensible de Langues et d’Accents Résumé: Les modèles d’identification de langue (LID) à l’état de l’art fonctionnent de manière fiable pour une centaine de langues. Cependant, derrière le concept de langue se cache de nombreuses variations émanant d’accents et de dialectes divers. Il est tout simplement impossible d’annoter les données en prenant compte de toutes ces variations. De plus, la parole accentuée engendre un comportement inattendu des modèles de LID et très peu de données annotées existent pour pallier le problème. Ce manque d’annotation empêche aussi l’augmentation de donnée via la synthèse de parole accentuée. Ce séminaire aborde ces problématiques et propose une ébauche de solution fondée sur une collecte de données à grande échelle à partir de diffusions radiophoniques. Cela permet d’associer aux données des annotations indirectes sous forme de géolocalisations. Le séminaire explore ensuite le lien entre la robustesse aux accents et la capacité à modéliser des séquences. Enfin, nous montrons comment ces modèles permettent d’améliorer les modèles de LID, en particulier sur la parole accentuée, et de faciliter l’extraction automatique de données accentuées pour entrainer des systèmes de synthèse vocale.Bio: Matthew Wiesner est un chercheur à Johns Hopkins University et chercheur at Plus d'infos

Soutenance de thèse – Manh Tuan NGUYEN – 25/03/2026

19 mars 2026

Date: mercredi 25 mars à 14h Lieu: amphithéâtre Blaise du CERI. La présentation se déroulera en anglais. Le jury sera composé de: Titre: Évaluation perceptive des troubles de la parole et de la voix et son intégration dans un système automatique d’aide à la décision.Résumé: Les jugements perceptifs sont largement utilisés dans des domaines dépourvus de critères objectifs clairs ou de méthodes de mesure fiables, ce qui nécessite le recours à l’évaluation par des experts humains. Toutefois, ces jugements sont intrinsèquement subjectifs, ce qui entraîne souvent un manque de concordance et, par conséquent, une variabilité lorsque plusieurs experts évaluent le même matériau. Cette variabilité, appelée variabilité inter-juges, est généralement traitée par l’agrégation des scores ou par un vote majoritaire afin de produire une décision consensuelle. Bien qu’e!cace pour obtenir une décision finale, cette approche laisse largement inexplorées les causes sous-jacentes de la variabilité inter-juges.Cette thèse vise à expliquer la variabilité inter-juges plutôt que de considérer les décisions consensuelles comme une référence absolue. Nous soutenons que cette variabilité peut résulter de différences systématiques entre les experts, notamment en termes de parcours professionnel, de formation, mais également de dimensions perceptives privilégiées lors de l’évaluation. En réduisant les jugements individuels à un score consensuel unique, les approches traditionnelles Plus d'infos

Séminaire CORNET – Younes Ben Mazziane – 20/03/2026

16 mars 2026

Date: 20/03/2026 à 11h30 Lieu: Salle C057 Titre: Learning in Proportional Allocation Auctions Games Résumé : The Kelly or proportional allocation mechanism is a simple and efficient auction-based scheme that distributes an infinitely divisible resource proportionally to the agents’ bids. When agents are aware of the allocation rule, their interactions form a game, that has been extensively studied. This paper examines the less explored repeated Kelly game, focusing mainly on utilities that are logarithmic in the allocated resource fraction. We first derive this logarithmic form from fairness–throughput trade-offs in wireless network slicing, and then prove that the induced stage game admits a unique Nash equilibrium (NE). For the repeated play, we prove convergence to this NE under three behavioral models: (i) all agents use Online Gradient Descent (OGD), (ii) all agents use Dual Averaging with a quadratic regularizer (DAQ) (a variant of the Follow-the-Regularized leader algorithm), and (iii) all agents play myopic best responses (BR). Our convergence results hold even when agents use personalized learning rates in OGD and DAQ (e.g., tuned to optimize individual regret bounds), and they extend to a broader class of utilities that meet a certain sufficient condition. Finally, we complement our theoretical results with extensive Plus d'infos

Séminaire SLG – Tom Labiausse – 16/03/2026

12 mars 2026

16 mars à 13h Tom présentera ses derniers travaux sur Hibiki-Zero, un modèle de traduction simultanée de la parole vers la parole. Les améliorations par rapport à ses travaux précédents, Hibiki, sont vraiment très intéressantes et s’appuient sur une technique d’apprentissage par renforcement (GRPO). Utilisée comme le propose Tom, cette technique évite d’avoir à préparer des données d’apprentissage parole-parole alignées au niveau mot comme dans la première mouture d’Hibiki. Vous êtes invités à assister à cette présentation qui pourrait vous donner des idées d’application à certains de vos travaux. Pour plus d’information, vous pouvez consulter cette page web très instructive et accessible (exemples, code, article) :