La description d’une voix en quelques mots reste une tâche très arbitraire. On peut parler avec une voix ‘profonde’, ‘soufflée’, ‘claire’ ou ‘rauque’, mais la caractérisation complète d’une voix nécessiterait un ensemble précis d’attributs rigoureusement définis constituant une ontologie. Cependant, une telle grille de description n’existe pas. L’apprentissage automatique appliqué à la parole souffre de la même faiblesse : dans la plupart des tâches de traitement automatique, lorsqu’un locuteur est modélisé, des représentations globales abstraites sont utilisées sans rendre leurs caractéristiques explicites. Plus d'infos
La guerre de 4ème génération (4GW) est connue comme étant la guerre de l’information impliquant des populations non nécessairement militaires. Elle est menée par des groupes nationaux ou transnationaux qui suivent des idéologies fondées sur des convictions culturelles, sur la religion, sur les intérêts économiques ou politiques avec comme objectif de semer le chaos dans un endroit visé du monde. Plus d'infos
UMICrowd a pour objectif de comprendre les dynamiques du crowdfunding, d’explorer sa dimension sociale et de modéliser les interactions entre ses différents acteurs. Cette compréhension et cette modélisation permettront de développer un cadre d’aide à la décision pour les plateformes dans le processus de classification, sélection et promotion des projets, avec pour objectif d’augmenter son impact socio-environnemental. Plus d'infos
PARFAIT s’attaque aux nouveaux problèmes d’allocation des ressources pour des applications relevant de l’IA et composées de microservices containairisés. Plus d'infos
Dans le contexte des troubles de la production de la parole observés dans les cancers ORL, les pathologies neurologiques, sensorielles ou structurelles, l’objectif du projet RUGBI est d’apporter des améliorations à la mesure du déficit d’intelligibilité. Plus d'infos
Former les modèles d’apprentissage automatique à effectuer des tâches en langage naturel
Internet contient de vastes quantités de données et d’informations, écrites et audiovisuelles, et dans de nombreuses langues différentes. Il est de plus en plus nécessaire de tirer profit de cette ressource largement inexploitée. Le projet SELMA, financé par l’UE, s’intéressera à l’ingestion et la surveillance de grandes quantités de données. Le projet formera systématiquement des modèles d’apprentissage automatique à effectuer des tâches en langage naturel et utilisera ces modèles pour surveiller les flux de données, dans le but d’améliorer la surveillance des médias multilingues et la production de contenus d’actualité. À terme, le projet permettra de faire progresser les techniques de pointe en matière de modélisation du langage, de traduction automatique et de reconnaissance et synthèse de la parole. Plus d'infos
Dans muDialBot, notre ambition est d’incorporer pro-activement des traits de comportements humains dans la communication parlée humain-robot. Nous projetons d’atteindre une nouvelle étape de l’exploitation de l’information riche fournie par les flux de données audio et visuelles venant des humains. En particulier en extraire des événements verbaux et non-verbaux devra permettre d’accroître les capacités de décision des robots afin de gérer les tours de parole plus naturellement et aussi de pouvoir basculer d’interactions de groupe à des dialogues en face-à-face selon la situation. Plus d'infos
Les technologies de traitement de la parole sont cruciales pour de nombreuses applications commerciales. Le projet ESPERANTO, financé par l’UE, vise à rendre la prochaine génération d’algorithmes d’IA utilisés dans les applications de traitement de la parole plus accessibles. Plus d'infos
AISSPER vise à développer de nouveaux modèles sémantiques au niveau de la phrase et au niveau de la conversation pour l’extraction d’information pertinente depuis des documents parlés. Plus précisément, AISSPER développera de nouveaux mécanismes d’attention neuronaux pour améliorer les systèmes SLU neuronaux de bout en bout au niveau de la phrase et au niveau du document. Plus d'infos
L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C’est en particulier vrai des données des marchés publics, aujourd’hui disponibles, et sur lesquelles est fondé l’espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l’efficacité du droit. Alliant Informatique, Économie et Droit, DéCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention. Plus d'infos
Nous utilisons des cookies pour vous garantir la meilleure expérience sur notre site web. Si vous continuez à utiliser ce site, nous supposerons que vous en êtes satisfait.