Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr)
Durée : de 3 à 6 mois
Titre : Restauration de la parole pathologique à base d’apprentissage profond
Descriptif :
Bien que les modes de communication aient largement évolué depuis une vingtaine d’années avec l’ère du numérique, pouvant se substituer dans de nombreuses situations à la parole – messagerie électronique, réseaux sociaux, blogs, messageries instantanées… la parole reste indispensable pour une bonne intégration dans notre société. La communication orale permet de partager avec les autres, que ce soit dans le monde professionnel ou la vie de tous les jours : partager pour exprimer une demande, pour informer, pour conseiller, pour débattre, pour convaincre, pour enseigner, pour divertir, pour exprimer un sentiment, … pour vivre en société.
La démocratisation de la téléphonie mobile, des réseaux de communication, des logiciels de visioconférences et de l’accès à Internet fait que nous pouvons communiquer oralement partout avec tous nos contacts professionnels ou personnels, quelle que soit leur localisation géographique. Aussi, au vu de l’importance de la communication orale, perdre la parole ou le langage peut être ressenti comme une perte d’humanité.
Les troubles de la communication sont définis par The American Speech and Hearing Association de la manière suivante : « An impairment in the ability to receive, send, process, and comprehend concepts or verbal, nonverbal and graphic symbol systems. A communication disorder may be evident in the processes of hearing, language, and/or speech. A communication disorder may range in severity from mild to profound. It may be developmental or acquired. Individuals may demonstrate one or any combination of the three aspects of communication disorders. A communication disorder may result in a primary disability or it may be secondary to other disabilities » (ASHA, 1993). Sur la base de cette définition, les troubles de la communication englobent toute altération au niveau de la voix, de la parole, du langage et de l’audition nuisant à la communication. Une enquête réalisée aux Etats-Unis en 2012 estime à 10% le nombre de personnes disant souffrir d’un trouble de la communication (seulement 2% se déclarant sur la base d’un diagnostic clinique) (Morris et al., 2016).
Nous nous intéresserons ici aux troubles de la voix et de la parole. Ces troubles peuvent être liés soit à des dommages de l’appareil phonatoire – troubles de la voix appelés dysphonie -, soit à des atteintes neurologiques induisant des troubles moteurs – appelés dysarthrie -, ou encore à des dommages liés à une malformation ou à un cancer localisé au niveau de l’appareil de production de la parole – appelés cancers des Voies Aéro-Digestives Supérieures (VADS), cancers du cou et de la tête ou cancers ORL.
Le LIA travaille depuis une vingtaine d’années sur les troubles de la voix et de la parole, et plus particulièrement sur la manière dont les outils de traitements automatiques peuvent aider les experts cliniciens et phonéticiens dans leur analyse acoustico-phonétique du signal de parole et perceptive des productions des sujets (contrôles et patients). Ces travaux ont pour objectifs de mieux comprendre les dégradations inhérentes aux troubles et de fournir, in fine, des approches d’évaluation objectives de ces dégradations, utilisables en pratique clinique, et plus récemment des approches de restauration de la parole dégradée.
Ce sujet de stage s’inscrit dans cette dernière perspective et dans le cadre d’un projet qui a débuté en janvier 2025 avec des partenaires académiques et cliniques du LIA. Il s’agira de tester différentes approches de clonage de voix à partir d’enregistrement de sujets sains et pathologiques afin d’analyser le comportement de ces approches sur de la parole dont l’intelligibilité est dégradée et ce en fonction de différents niveaux de dégradation.