Projet ANR DEEP-PRIVACY

Apprentissage distribué, personnalisé, préservant la privacité pour le traitement de la parole

Le projet concerne le développement d’approches distribuées, personnalisées et préservant la vie privée pour la reconnaissance de la parole. Nous proposons une approche dans laquelle le terminal de chaque utilisateur exécute localement des calculs privés et ne partage pas ses données vocales brutes, alors que certains calculs inter-utilisateurs (telles que l’enrichissement de modèles) sont réalisés sur un serveur ou un réseau peer-to-peer, avec des données vocales partagées après anonymisation.
Objectifs

La reconnaissance vocale est maintenant utilisée dans de nombreuses applications, dont les assistants virtuels qui collectent, traitent et stockent des données vocales personnelles sur des serveurs centralisés, ce qui soulève de sérieuses préoccupations concernant la privacité. L’utilisation d’une reconnaissance vocale embarquée permet de traiter ces aspects de privacité, mais seulement pendant la phase de reconnaissance de la parole. Cependant, il y a encore besoin d’améliorer davantage la technologie de reconnaissance vocale car ses performances restent limitées dans des conditions défavorables (e.g., environnements bruyants, parole réverbérée, accents forts, etc). Cela ne peut être obtenu qu’à partir de grands corpus de parole représentatifs de conditions d’utilisation réelles et variées. Il est donc nécessaire de partager des données vocales tout en garantissant la privacité. Les améliorations obtenues grâce aux données vocales partagées seront alors bénéfiques pour tous les utilisateurs. <br /><br />Dans ce contexte, DEEP-PRIVACY propose un nouveau paradigme basé sur une approche distribuée, personnalisée et préservant la privacité. Certains traitements sont effectués sur le terminal de l’utilisateur, ce qui garantit la privacité, et permet de personnaliser des traitements pour optimiser les performances. En ce qui concerne les données de parole à partager sur un serveur ou un réseau peer-to-peer, elles doivent être anonymisées avant d’être partagées. Cela définit les objectifs du projet : le premier concerne l’apprentissage de représentations du signal vocal préservant la vie privée, tandis que le deuxième concerne les algorithmes distribués et la personnalisation.

Liste des partenaires :

Coordinateur du projet : INRIA Grand Est

Responsable Scientifique pour le LIA : Yannick ESTEVE

Date Début : 01/01/2019   Date Fin : 30/06/2023

En Savoir Plus