Je soutiendrai le mercredi 16 juin 2021 à 9h mon HDR intitulée « Combining Heterogeneous Information: Contributions to the Extraction and Analysis of Feature-Rich Complex Networks ».
La présentation sera en anglais, et aura lieu en visio au lien https://pod.univ-avignon.fr/live/colloque/
Vous êtes bien sûr toutes et tous invité(e)s à y assister.
Jury :
- Céline Rouveirol, Professeur, Université Sorbonne Paris Nord, LIPN, Présidente
- Éric Gaussier, Professeur, Université Grenoble Alpes, LIG, Rapporteur
- Jean-Loup Guillaume, Professeur, Université de La Rochelle, L3i, Rapporteur
- Maguelonne Teisseire, Directrice de recherche, INRAE, UMR Tetis, Rapportrice
- Roger Guimerà, Professeur, Universitat Rovira i Virgili, ICREA, Examinateur
Résumé : Le concept de Réseau Complexe (ou Graphe de Terrain) est généralement utilisé dans la littérature pour faire référence à un graphe représentant un système complexe du monde réel. Cela confère à ces graphes des propriétés topologiques qualifiées de non-triviales, qui les distinguent des graphes réguliers et aléatoires. Les plus connues sont les propriétés petit-monde et sans-échelle, dont la découverte a marqué le début d’un nouveau domaine de recherche appelé Science des Réseaux, et visant à étudier les réseaux complexes. Il s’agit d’un champ multidisciplinaire reposant sur de nombreux domaines pré-existants, en particulier la théorie des graphes, la sociologie quantitative, l’informatique, la recherche opérationnelle, la physique statistique, et bien sûr l’étude des systèmes complexes. Ce point de départ basé sur la modélisation de systèmes réels fait de la science des réseaux une science des données. En tant que telle, son émergence est due non seulement à la convergence de travaux interdisciplinaires, mais aussi à la disponibilité des ressources nécessaires à la construction et à l’étude de larges collections de grands réseaux complexes, à savoir : une puissance computationnelle suffisante et l’accès à des données appropriées. En raison de cette dépendance aux données, la représentation de l’information est une problématique fondamentale de la science des réseaux. La façon dont les données décrivant le système considéré sont intégrées au graphe constituant son modèle est de la plus grande importance. Or, un graphe basique ne permet de modéliser qu’un seul type d’information : la présence ou l’absence de relation entre les objets constituant le système. Pour exploiter des données plus diverses, il est nécessaire d’étendre ce type de modèle, ce qui nous amène à la notion de Réseau Enrichi, qui est au cœur de cette thèse. Dans ce manuscrit, je résume le travail que j’ai mené sur le sujet de ces réseaux enrichis. Dans la première partie, je considère les réseaux dont les sommets sont décrits par des attributs. Le Chapitre 2 s’intéresse à la détection de communautés, et présente une comparaison de sous-groupes de sommets identifiés sur la base de la structure du graphe et sur celle des attributs de ces nœuds. Le Chapitre 3 traite de deux problèmes de classification : le premier consiste à détecter des personnes influentes dans la vie réelle, en exploitant seulement des données décrivant leur activité sur un média social ; et le second porte sur l’identification de messages abusifs dans des salons de discussion en ligne. La deuxième partie est dédiée aux réseaux dynamiques. Le Chapitre 4 propose deux méthodes tirant parti de méthodes de fouille de motifs séquentiels pour caractériser la dynamique de ces réseaux à deux niveaux. La première vise à les décrire au niveau microscopique (sommets), et la seconde au niveau mésoscopique (communautés). Dans le Chapitre 5, je présente une méthode basée sur la segmentation de graphes dynamiques, et visant à générer des résumés vidéo de séries télévisées. La troisième partie couvre trois types de réseaux enrichis. Le Chapitre 6 est dédié aux réseaux spatiaux, et présente deux travaux portant sur la mesure de Rectitude. Le sujet du Chapitre 7 est le partitionnement de graphes signés et le concept d’équilibre structural. Le Chapitre 8 porte sur les réseaux multiplexes. J’y décris une mesure de centralité basée sur un modèle de diffusion d’opinion à travers plusieurs médias sociaux, et une méthode de partitionnement de graphes permettant d’identifier plusieurs structures modulaires au sein du même réseau multiplexe.