Offre de stage: Restauration de la parole pathologique à base d’apprentissage profond

Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr)

Durée : de 3 à 6 mois

Titre : Restauration de la parole pathologique à base d’apprentissage profond

Descriptif :

Bien que les modes de communication aient largement évolué depuis une vingtaine d’années avec
l’ère du numérique, pouvant se substituer dans de nombreuses situations à la parole – messagerie
électronique, réseaux sociaux, blogs, messageries instantanées… la parole reste indispensable pour
une bonne intégration dans notre société. La communication orale permet de partager avec les
autres, que ce soit dans le monde professionnel ou la vie de tous les jours : partager pour exprimer 
une demande, pour informer, pour conseiller, pour débattre, pour convaincre, pour enseigner, pour
 divertir, pour exprimer un sentiment, … pour vivre en société.


La démocratisation de la téléphonie mobile, des réseaux de communication, des logiciels de
visioconférences et de l’accès à Internet fait que nous pouvons communiquer oralement partout
 avec tous nos contacts professionnels ou personnels, quelle que soit leur localisation géographique.
 Aussi, au vu de l’importance de la communication orale, perdre la parole ou le langage peut être 
ressenti comme une perte d’humanité.


Les troubles de la communication sont définis par The American Speech and Hearing Association
 de la manière suivante : « An impairment in the ability to receive, send, process, and comprehendconcepts or verbal, nonverbal and graphic symbol systems. A communication disorder may beevident in the processes of hearing, language, and/or speech. A communication disorder may rangein severity from mild to profound. It may be developmental or acquired. Individuals maydemonstrate one or any combination of the three aspects of communication disorders. Acommunication disorder may result in a primary disability or it may be secondary to otherdisabilities » (ASHA, 1993). Sur la base de cette définition, les troubles de la communication
 englobent toute altération au niveau de la voix, de la parole, du langage et de l’audition nuisant à la
 communication. Une enquête réalisée aux Etats-Unis en 2012 estime à 10% le nombre de 
personnes disant souffrir d’un trouble de la communication (seulement 2% se déclarant sur la base 
d’un diagnostic clinique) (Morris et al., 2016).


Nous nous intéresserons ici aux troubles de la voix et de la parole. Ces troubles peuvent être liés 
soit à des dommages de l’appareil phonatoire – troubles de la voix appelés dysphonie -, soit à des
 atteintes neurologiques induisant des troubles moteurs – appelés dysarthrie -, ou encore à des
 dommages liés à une malformation ou à un cancer localisé au niveau de l’appareil de production de
la parole – appelés cancers des Voies Aéro-Digestives Supérieures (VADS), cancers du cou et de latête ou cancers ORL.


Le LIA travaille depuis une vingtaine d’années sur les troubles de la voix et de la parole, et plus
particulièrement sur la manière dont les outils de traitements automatiques peuvent aider les experts
cliniciens et phonéticiens dans leur analyse acoustico-phonétique du signal de parole et perceptive
 des productions des sujets (contrôles et patients). Ces travaux ont pour objectifs de mieux
 comprendre les dégradations inhérentes aux troubles et de fournir, in fine, des approches 
d’évaluation objectives de ces dégradations, utilisables en pratique clinique, et plus récemment des
 approches de restauration de la parole dégradée.

Ce sujet de stage s’inscrit dans cette dernière perspective et dans le cadre d’un projet qui a débuté
 en janvier 2025 avec des partenaires académiques et cliniques du LIA. Il s’agira de tester différentes
approches de clonage de voix à partir d’enregistrement de sujets sains et pathologiques afin
 d’analyser le comportement de ces approches sur de la parole dont l’intelligibilité est dégradée et ce
 en fonction de différents niveaux de dégradation.