Séminaire Cornet – Andrea Fox – 08/12/2023

22 novembre 2023

Dans le cadre des séminaires de l’équipe Cornet, Andrea Fox (LIA) présentera son travail de recherche sur Safe Reinforcement Learning for Video Admission Control, le 8 décembre 2023 à 11h35 en salle de réunion. Résumé : Les caméras vidéo mobiles sont devenues une commodité omniprésente et représentent une source candidate importante pour améliorer les applications d’analyse vidéo. Cependant, bien qu’abondantes en quantité, les limites de l’infrastructure informatique périphérique nécessitent une sélection minutieuse des flux vidéo à traiter à tout moment pour maximiser la quantité d’informations extraites par les applications déployées. Dans cet article, nous présentons un schéma de contrôle d’admission pour les flux vidéo mobiles provenant de différentes zones et envoyés à plusieurs serveurs de traitement sur une infrastructure informatique périphérique. Nous introduisons un modèle ancré dans la théorie des Processus de Décision Markoviens Contraints (CMDP) qui capture le problème d’assurer une couverture adéquate des zones pour les applications, tout en tenant compte des contraintes des serveurs périphériques et de la capacité du réseau d’accès. Sur la base de ce modèle, nous développons deux nouvelles politiques basées sur des méthodes spécialisées d’apprentissage par renforcement contraintes primal-dual qui résolvent le problème de contrôle d’admission optimal. La première, appelée DR-CPO, adopte la Plus d'infos

Séminaire Cornet – Olivier Bilenne – 24/11/2023

22 novembre 2023

Dans le cadre des séminaires de l’équipe Cornet, Olivier Bilenne (LIA) présentera son travail de recherche sur Implementing fictitious play in partially observable stochastic games, le 24 novembre 2023 à 11h35 en salle de réunion. Résumé : Des extensions du jeu fictif aux jeux stochastiques ont été récemment examinées en combinaison avec des techniques d’apprentissage par renforcement inhérentes aux processus de décision de Markov. Nous revisitons cette approche dans le contexte des jeux stochastiques partiellement observables. Pour cela, nous considérons un jeu stochastique à somme nulle à deux joueurs (à états finis) où un joueur (l’attaquant) a une visibilité complète sur le système, tandis que l’autre joueur (le défenseur) n’a pas accès à l’état de l’adversaire et doit plutôt composer avec des sources d’information publiques (dans notre contexte : les actions jouées et leurs gains associés). Nous étudions une dynamique de jeu fictif où les joueurs répondent au mieux aux fréquences empiriques estimées des actions de leur adversaire. Cette séquence de jeu demande aux joueurs de former des croyances à la fois sur la stratégie de leur adversaire et sur leur propre gain de continuation (modélisé par une fonction Q), en se basant sur l’information (complète ou partielle) qui leur Plus d'infos

14th Conference on Decision and Game Theory for Security (GameSec-23)

10 novembre 2023

La 14th Conference on Decision and Game Theory for Security (GameSec-23) se tiendra du 18 au 20 octobre 2023 à Avignon. Avec le développement rapide des technologies de l’information, de l’automatisation et de la communication, la sécurité de ces systèmes émergents est plus importante que jamais. GameSec 2023 se concentre sur la protection des systèmes cyber-physiques hétérogènes, à grande échelle et dynamiques, ainsi que sur la gestion des risques de sécurité auxquels sont confrontées les infrastructures critiques grâce à des méthodes analytiques rigoureuses et pratiquement pertinentes. GameSec 2023 invite des contributions théoriques et empiriques nouvelles et de haute qualité, qui exploitent la théorie de la décision et la théorie des jeux pour résoudre des problèmes de sécurité et des problèmes connexes tels que la vie privée, la confiance ou les biais dans les systèmes émergents. L’objectif de la conférence est de réunir des chercheurs universitaires, gouvernementaux et industriels dans le but d’identifier et de discuter des principaux défis et des résultats récents qui mettent en lumière les liens interdisciplinaires entre la théorie des jeux, le contrôle, l’optimisation distribuée, le raisonnement adversaire, l’apprentissage automatique, la conception de mécanismes, l’analyse comportementale, les évaluations des risques, la sécurité, la réputation, la confiance et Plus d'infos