Projet ANR AISSPER
AISSPER vise à développer de nouveaux modèles sémantiques au niveau de la phrase et au niveau de la conversation pour l’extraction d’information pertinente depuis des documents parlés. Plus précisément, AISSPER développera de nouveaux mécanismes d’attention neuronaux pour améliorer les systèmes SLU neuronaux de bout en bout au niveau de la phrase et au niveau du document.
Projet ANR BRUEL
Le projet BRUEL concerne l’évaluation/certification des systèmes d’identification par la voix face aux attaques adverses.
En effet, les systèmes de reconnaissance automatique du locuteur sont vulnérables non seulement à la parole produite artificiellement par synthèse vocale, mais aussi à d’autres formes d’attaques telles que la conversion d’identité vocale et la relecture. Les artefacts créés lors de la création ou la manipulation de ces attaques frauduleuses constituent les marques laissées dans le signal par les algorithmes de synthèse vocale permettant ainsi de distinguer la voix réelle originale d’une voix usurpée.
Projet ANR DéCoMaP
L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C’est en particulier vrai des données des marchés publics, aujourd’hui disponibles, et sur lesquelles est fondé l’espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l’efficacité du droit. Alliant Informatique, Économie et Droit, DéCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention.
Projet ANR DEEP-PRIVACY
Le projet concerne le développement d’approches distribuées, personnalisées et préservant la vie privée pour la reconnaissance de la parole. Nous proposons une approche dans laquelle le terminal de chaque utilisateur exécute localement des calculs privés et ne partage pas ses données vocales brutes, alors que certains calculs inter-utilisateurs (telles que l’enrichissement de modèles) sont réalisés sur un serveur ou un réseau peer-to-peer, avec des données vocales partagées après anonymisation.
Projet ANR DELIGHT
Le projet DELIGHT vise à évaluer finement et à réduire la consommation énergétique de l’apprentissage fédéré en utilisant différents leviers (compression de gradient, data summarization, speed-scaling, etc.).
Projet ANR ESSL
L’apprentissage auto-supervisé (Self-Supervised Learning ou SSL) a émergé récemment comme une méthode d’intelligence artificielle (IA) incroyablement prometteuse. Grâce à cette méthode, les colossales masses de données non annotées qui sont accessibles peuvent être utilisées par des systèmes d’IA pour dépasser les performances connues jusque-là. En particulier, le domaine du traitement automatique de la parole (TAP) se voit rapidement transformé par l’arrivée du SSL grâce, notamment, aux investissements industriels massifs et l’explosion des données, tous deux mis à disposition par une poignée d’entreprises.
Projet ANR EVA
La description d’une voix en quelques mots reste une tâche très arbitraire. On peut parler avec une voix ‘profonde’, ‘soufflée’, ‘claire’ ou ‘rauque’, mais la caractérisation complète d’une voix nécessiterait un ensemble précis d’attributs rigoureusement définis constituant une ontologie. Cependant, une telle grille de description n’existe pas. L’apprentissage automatique appliqué à la parole souffre de la même faiblesse : dans la plupart des tâches de traitement automatique, lorsqu’un locuteur est modélisé, des représentations globales abstraites sont utilisées sans rendre leurs caractéristiques explicites.
Projet ANR FINALITY
FINALITY is a MSCA DN forming a novel AI curriculum for engineering researchers exploring safe techniques for socio-technical systems where human decisions for resource allocation are supported by AI.
Projet ANR MALADES
As part of the MALADES project, we presented innovative approaches for the integration of LLM in health centers. The aim is to equip these centers with NLP tools derived from LLMs and adapted for the biomedical field while maintaining sovereignty of the models and complete control of their health data.
Projet ANR muDialBot
Dans muDialBot, notre ambition est d’incorporer pro-activement des traits de comportements humains dans la communication parlée humain-robot. Nous projetons d’atteindre une nouvelle étape de l’exploitation de l’information riche fournie par les flux de données audio et visuelles venant des humains. En particulier en extraire des événements verbaux et non-verbaux devra permettre d’accroître les capacités de décision des robots afin de gérer les tours de parole plus naturellement et aussi de pouvoir basculer d’interactions de groupe à des dialogues en face-à-face selon la situation.
Projet ANR PANTAGRUEL
Le projet Pantagruel (ANR 23-IAS1-0001) ambitionne de développer et évaluer des modèles linguistiques multimodaux (écrit, oral, pictogrammes) inclusifs pour le français. Il mobilise des chercheurs de diverses disciplines telles que l’informatique, le traitement du signal, la sociologie et la linguistique pour assurer des résultats fiables et variés.
Projet ANR PARFAIT
PARFAIT s’attaque aux nouveaux problèmes d’allocation des ressources pour des applications relevant de l’IA et composées de microservices containairisés.
Projet ANR ROBOVOX
Ce projet est dédié à l’identification vocale robuste pour les robots de sécurité mobiles et propose des solutions intégrant des modalités d’appoint à la reconnaissance de la voix, tirant partie du contexte d’interaction homme-robot.
Projet ANR RUGBI
Dans le contexte des troubles de la production de la parole observés dans les cancers ORL, les pathologies neurologiques, sensorielles ou structurelles, l’objectif du projet RUGBI est d’apporter des améliorations à la mesure du déficit d’intelligibilité.
Projet ANR TRADEF
La guerre de 4ème génération (4GW) est connue comme étant la guerre de l’information impliquant des populations non nécessairement militaires. Elle est menée par des groupes nationaux ou transnationaux qui suivent des idéologies fondées sur des convictions culturelles, sur la religion, sur les intérêts économiques ou politiques avec comme objectif de semer le chaos dans un endroit visé du monde.
Projet ANR UMICROWD
UMICrowd a pour objectif de comprendre les dynamiques du crowdfunding, d’explorer sa dimension sociale et de modéliser les interactions entre ses différents acteurs. Cette compréhension et cette modélisation permettront de développer un cadre d’aide à la décision pour les plateformes dans le processus de classification, sélection et promotion des projets, avec pour objectif d’augmenter son impact socio-environnemental.
Projet ANR VoicePersonae
Grâce aux avancées récentes en traitement automatique de la parole et du langage, les humains sont de plus en plus fréquemment en position d’interagir par la voix avec des agents artificiels intelligents. Le nombre d’applications utilisant ainsi la voix est en forte expansion et ce mode d’interaction est de plus en plus accepté. De nos jours, les systèmes vocaux peuvent proposer des messages synthétisés d’une telle qualité qu’il est difficile de les discerner de messages enregistrés par un humain. Ils sont également capables de comprendre des requêtes exprimées en langage naturel, toutefois en restant dans leur cadre applicatif précis. Enfin, ces systèmes reconnaissent ou identifient fréquemment leurs utilisateurs par leur voix.
Projet COGNETS
CoGNETs vise à révolutionner la gestion de l’infrastructure intelligente en introduisant un cadre middleware middleware distribué évolutif et interopérable pour l’informatique autonome IoT-to-Cloud
Projet DAPADAF-E
Validity of a task of acoustic-phonetic decoding on anatomic deficits in paramedical assessment of speech disorders for patients treated for oral or oropharyngeal cancer
Projet H2020 ESPERANTO
Les technologies de traitement de la parole sont cruciales pour de nombreuses applications commerciales. Le projet ESPERANTO, financé par l’UE, vise à rendre la prochaine génération d’algorithmes d’IA utilisés dans les applications de traitement de la parole plus accessibles.
Projet H2020 SELMA
Former les modèles d’apprentissage automatique à effectuer des tâches en langage naturel
Internet contient de vastes quantités de données et d’informations, écrites et audiovisuelles, et dans de nombreuses langues différentes. Il est de plus en plus nécessaire de tirer profit de cette ressource largement inexploitée. Le projet SELMA, financé par l’UE, s’intéressera à l’ingestion et la surveillance de grandes quantités de données. Le projet formera systématiquement des modèles d’apprentissage automatique à effectuer des tâches en langage naturel et utilisera ces modèles pour surveiller les flux de données, dans le but d’améliorer la surveillance des médias multilingues et la production de contenus d’actualité. À terme, le projet permettra de faire progresser les techniques de pointe en matière de modélisation du langage, de traduction automatique et de reconnaissance et synthèse de la parole.
Projet MUGS
Développer des modèles avançés de théorie des jeux (jeux stochastiques partiellement observables, apprentissage par renforcement et utilisation des propriétés de centralité/connectivité des graphes, …) sur les graphes avec application au contrôle de malware/attaque dans un réseau.