Soutenance de thèse Thibault Bañeras-Roux – 17/01/2025
Titre: Analyse et compréhension de l’évaluation des systèmes de reconnaissance automatique de la parole : vers des métriques intégrant la perception humaine Date: 17 janvier à 14h00Lieu: Amphithéâtre du bâtiment 34, LS2N, Campus Lombarderie, 2 chemin de laHoussinière 44000 Nantes. Cette soutenance se déroulera en français. Abstract : De nos jours, le taux d’erreur mot reste la métrique la plus utiliséepour évaluer les systèmes de reconnaissance automatique de la parole(RAP). Toutefois, cette métrique présente des limites en matière decorrélation avec la perception humaine et ne se concentre que sur lapréservation de l’orthographe. Dans cette thèse, nous proposons desmétriques alternatives qui peuvent évaluer l’orthographe, mais aussi lagrammaire, la sémantique ou la phonétique. Pour analyser la capacité de ces métriques à refléter la qualité destranscriptions du point de vue des utilisateurs, nous avons constitué unjeu de données nommé HATS, annoté par 143 sujets francophones. Chaqueannotateur a examiné 50 triplets, composés d’une transcription deréférence manuelle et de deux hypothèses issues de différents systèmesde RAP, afin de déterminer quelle hypothèse était, selon eux, la plusfidèle. En calculant le nombre de fois où une métrique est d’accord avec leschoix des annotateurs, on obtient une mesure de sa corrélation avec laperception humaine. Ce corpus permet ainsi Plus d'infos