Stage Master Recherche – 6 mois
Contact : Corinne Fredouille (corinne.fredouille@univ-avignon.fr)
Le terme « troubles de la parole » fait référence à l’ensemble des déficiences affectant la production de la parole chez un être humain. Le bégaiement est un exemple de troubles de la parole. Le LIA travaille depuis une dizaine d’années sur les troubles de la parole, et plus particulièrement sur la manière dont les outils de traitements automatiques peuvent aider les cliniciens et les phonéticiens dans leur analyse acoustico-phonétique du signal de parole et/ou perceptive des productions de parole en vue de mieux comprendre les dégradations inhérentes aux troubles de la parole. Les travaux les plus récents portent notamment sur l’étude d’un système de détection automatique de déviances dans des productions de parole dégradée [Laaridh et al., 2015] ou d’un système automatique de prédiction du degré d’intelligibilité basé sur des i-vecteurs [Laaridh et al., 2017 ; Laaridh et al., 2018]. Dans un premier temps, ces approches ont été appliquées sur des
productions de parole dégradée produites par des patients atteints de lésions neurologiques localisées dans le système nerveux central ou périphérique. On parle alors de trouble moteur de la parole d’origine neurologique, désigné sous le terme de dysarthrie. La dysarthrie peut être l’un des symptômes de différentes maladies telles que la maladie de Parkinson, la Sclérose Latérale Amyotrophique (SLA), les Accidents Vasculaires Cérébraux, etc. Ces différentes maladies se
distinguent notamment par la localisation des lésions neurologiques et, par conséquent, par le type de troubles moteur (faiblesse musculaire, mouvements involontaires, imprécision des mouvements …) et le type de dégradations de la parole qu’elles peuvent engendrer (distorsion des voyelles, imprécision des consonnes, altération du débit, hypernasalité, …). Ces approches ont été, dans un deuxième temps, évaluées sur des productions de parole dégradées issues de patients atteints de cancers des voies aérodigestives supérieures (présence de tumeurs) et/ou suite à des traitements thérapeutiques inhérents (exérèse, radiothérapie, etc). En fonction de la maladie et de son évolution, les troubles moteur du patient pourront être évalués de manière perceptive (« à l’oreille ») par le clinicien sur une échelle de sévérité allant d’une
dysarthrie légère à sévère. Sur une échelle similaire, le clinicien pourra également juger du degré d’intelligibilité de la parole d’un patient ie sa capacité à transmettre un message oral à un auditeur. Malgré son caractère très subjectif, l’évaluation perceptive des troubles de la parole chez les patients reste la seule approche à l’heure d’aujourd’hui utilisée en pratique clinique. Au vu des progrès observés dans le traitement automatique de la parole ces dix dernières années, des solutions technologiques sont âprement attendues dans ce domaine pour aider les cliniciens dans leur bilan
clinique. Néanmoins, même si de nombreux travaux scientifiques portent sur l’utilisation d’approches automatiques pour une évaluation objective des troubles de la parole, aucune approche fiable n’est utilisée en pratique clinique.Depuis trois ans maintenant, le Laboratoire Parole et Langage développe un protocole spécifique dédié à l’évaluation de l’intelligibilité en milieu clinique. Ce protocole, dénommé DAP [Guio et al., 2018], (pour Décodage Acoustico-Phonétique) reprend une méthodologie classiquement utilisée par les cliniciens, basée sur la transcription manuelle de productions de séquences de parole réalisées par des patients. La première originalité de ce protocole comparé aux tests existant repose sur un dictionnaire de 90000 pseudo-mots à partir duquel des listes de 52 séquences sont proposées aux patients pour leur tâche de production. Ce dictionnaire de pseudo-mots permet de supprimer tout effet d’apprentissage ou d’habituation de la part du patient mais également de la part du clinicien dans sa tâche de transcription. La deuxième originalité de ce protocole est l’utilisation d’une mesure de comparaison entre le pseudo-mot cible et la transcription fournie par le clinicien permettantd’évaluer plus finement les erreurs de production du patient. En collaboration avec le LPL, le LIA a mené des travaux sur ce protocole en vue notamment de remplacer la transcription manuelle par la machine . Ces travaux sont toujours en cours de développement [Fredouille et al., 2019]. L’un de ces travaux, cité plus haut [Laaridh et al., 2018], a
consisté en la mise en place d’un système de prédiction de l’intelligibilité sur la base de productions de pseudo-mots par des patients dans le cadre du protocole DAP. L’une des contributions de ce travail a été de montrer que la composition des listes, en terme de nombre de pseudo-mots et de structures de ces derniers, pouvait avoir une influence sur les performances du système de prédiction et sur la qualité des modèles de locuteurs utilisés. L’objectif de ce stage est d’approfondir cette étude en collaboration avec le LPL en vue de définir la quantité minimale de pseudo-mots nécessaires à l’intérieur des listes pour garantir une bonne évaluation de l’intelligibilité chez les patients et les stratégies de compositions de ces listes, et ce dans un contexte de prédiction automatique de l’intelligibilité.
Références bibliographiques
[Laaridh et al., 2015] I. Laaridh, C. Fredouille, C. Meunier, « Automatic Detection of Phone-Based
Anomalies in Dysarthric Speech », ACM Transactions on Accessible Computing (TACCESS),
(Volume : 6 Issue 3), June 2015.
[Laaridh et al., 2017] I. Laaridh, W. Ben-Kheder, C. Fredouille, C. Meunier, « Automatic Prediction
of Speech Evaluation Metrics for Dysarthric Speech », Interspeech’2017, Stockholm, Sweden.
August 2017.
[Ghio et al., 2018] A. Ghio, M. Lalain, L. Giusti, G. Pouchoulin, D. Robert, et al.. Une mesure
d’intelligibilité par décodage acoustico-phonétique de pseudo-mots dans le cas de parole atypique.
XXXIIe Journées d’Etudes sur la Parole, LPL, 2018, Aix-en-Provence, France. pp.285-293
[Laaridh et al., 2018] I. Laaridh, C. Fredouille, A. Ghio, M. Lalain, V. Woisard, « Automatic
evaluation of speech intelligibility based on i-vectors in the context of Head and Neck Cancers »,
Interspeech’2018, Hyderabad, India. September 2018.
[Fredouille et al., 2019] C. Fredouille, A. Ghio, I. Laaridh, M. Lalain, V. Woisard. Acoustic-
phonetic decoding for speech intelligibility evaluation in the context of Head and Neck Cancers.
International Congress of Phonetic Sciences (ICPhS), 2019, Melbourne, Australia. pp.3051-3055.