PANG : Enumération de sous-graphes pour la détection d’anomalies dans les graphes

7 décembre 2023

Pang (Pattern-Based Anomaly Detection in Graphs) est un algorithme qui représente et classe une collection de graphes en fonction de leurs motifs fréquents (sous-graphes). Les détails de cet algorithme sont décrits dans l’article ci-dessous. Ce travail a été réalisé dans le cadre du projet ANR DeCoMaP (Détection de la corruption dans les marchés publics — ANR-19-CE38-0004). Plus d'infos

Détection d’abus dans des conversations en ligne

4 décembre 2023

Ce logiciel a été conçu pour détecter les messages abusifs dans les conversations en ligne. Deux approches principales sont mises en œuvre : l’une basée sur le contenu textuel et l’autre sur les graphes conversationnels, qui peuvent également être utilisées conjointement. Ce logiciel a été appliqué à un corpus de messages de discussion écrits en français, malheureusement impossible à publier en raison de questions légales. Cependant, les graphes conversationnels extraits de ces textes sont disponibles publiquement sur Zenodo. URL : https://github.com/CompNet/Alert Date de production : 2018–2023 Publications liées : Noé Cécillon, Vincent Labatut, Richard Dufour et Georges Linarès. « Graph embeddingsfor Abusive Language Detection ». In : Springer Nature Computer Science2:37 (2021). DOI: 10.1007/s42979-020-00413-7. ⟨hal-03042171⟩ Noé Cécillon, Vincent Labatut, Richard Dufour et Georges Linarès. « AbusiveLanguage Detection in Online Conversations by Combining Content- and Graph-basedFeatures ». In : International Workshop on Modeling and Mining Social Media Driven Complex Networks (Soc2Net). T. 2. Frontiers in Big Data 8. Munich, DE, 2019. DOI: 10.3389/fdata.2019.00008. ⟨hal-02130205⟩ (article à citer si vous utilisez le logiciel) Noé Cécillon, Vincent Labatut, Richard Dufour et Georges Linarès. « TuningGraph2vec with Node Labels for Abuse Detection in Online Conversations ». In :11ème Conférence sur les modèles et l’analyse Plus d'infos

Simulateur d’un processus de propagation dans un graphe

29 août 2023

Ce logiciel développé en Python dans le cadre du stage de Master 2 de Oumaima DIAMI permet d’observer la dynamique d’un processus de propagation dans un graphe. Plusieurs politiques de contrôle (Intrusion Detection Systems) peuvent être testées tout comme plusieurs types de propagation (unicast, broadcast, random, etc). Le logiciel permet de visualiser en temps réel les différents états des nœuds au fur et à mesure de la propagation. Un graphique permet également de voir l’évolution temporelle du processus de propagation. Enfin, différents types de réseaux peuvent être générés : aléatoire, ER ou petit-monde.

Réseau social de l’empereur Trajan

4 décembre 2020

Ces scripts visent à analyser un ensemble de données historiques décrivant les relations entre l’empereur romain Trajan et son entourage. Ils réalisent ce qui suit : Extraction de divers réseaux à partir de données tabulaires contenant des attributs individuels et relationnels issus des sources historiques. Calcul de statistiques et génération des graphiques correspondants, pour les tables et les graphes. Analyse séquentielle de certains attributs chronologiques.   URL : https://github.com/CompNet/TrajanNet Publication date: 2019–2020

Partitionnement multiple de réseaux signés multiplexes

4 décembre 2019

Ces scripts ont été conçus pour analyser les votes du Parlement européen à travers une approche basée sur les réseaux multiplexes. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement européen (MEP) pendant la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont été récupérées sur le site It’s Your Parliament. Il y avait quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées, ainsi que nos figures et résultats, sont disponibles sur Zenodo. URL : https://github.com/CompNet/MultiNetVotes Date de production : 2018–2019 Publications liées :  Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple partitioning of multiplexsigned networks : Application to European parliament votes ». In : Social Networks60:83-102 (2020). DOI: 10.1016/j.socnet.2019.02.001. ⟨hal-02082574⟩ (article à citer si vous utilisez ce logiciel) Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple Partitioning of MultiplexSigned Networks ». In : 21ème Congrès Annuel de la Société Française de RechercheOpérationnelle et d’Aide à la Décision (ROADEF). Montpellier, FR, 2020. ROADEF ⟨hal-02428300⟩    

Génération aléatoire de graphes signés

3 décembre 2018

Ces scripts ont été conçus pour générer aléatoirement des graphes signés possédant un certain type de structure de communautés, dans le but d’évaluer des algorithmes de partitionnement. Divers aspects des graphes peuvent être spécifiés par l’utilisateur. URL : https://github.com/CompNet/SignedBenchmark Date de production : 2017–2018 Publication liée : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiplicity and Diversity :Analyzing the Optimal Solution Space of the Correlation Clustering Problem onComplete Signed Graphs ». In : Journal of Complex Networks 8(6):cnaa025 (2020).DOI: 10.1093/comnet/cnaa025. ⟨hal-02994011⟩

Détection d’évènements sur le Web pour la Science Politique

3 décembre 2018

Ce logiciel prend le nom d’une personne publique et une période, et récupère tous les événements disponibles en ligne impliquant cette personne pendant cette période. Il effectue d’abord une recherche Web en utilisant divers moteurs, puis récupère les pages Web correspondantes, réalise une reconnaissance d’entités nommées (NER), utilise ces entités pour clusteriser les articles et considère chaque cluster comme la description d’un événement spécifique. Il est conçu pour gérer les pages Web en français, mais devrait également fonctionner pour l’anglais. URL : https://github.com/CompNet/TranspoloSearch Date de production : 2015–2018 Publications liées : Vincent Labatut et Guillaume Marrel. « La visibilité politique en ligne : Contributionà la mesure de l’e-reputation politique d’un maire urbain ». In : Big Data etvisibilité en ligne : Un enjeu pluridisciplinaire de l’économie numérique. Fort-de-France,FR, 2017, p. 271-286. ⟨hal-01904352⟩ Guillaume Marrel, Vincent Labatut et Marc El Bèze. « Le Web comme miroir dutravail politique quotidien? Reconstituer l’écho médiatique en ligne des événementsd’un agenda d’élu ». In : 13ème Congrès de l’Association Française de Science Politique(AFSP). Aix-en-Provence, FR, 2015, p. 25. AFSP ⟨hal-01904338⟩

Extraction et partitionnement de réseaux de votes

2 décembre 2018

Ces scripts ont été conçus dans trois objectifs : Générer une variété de graphiques et de statistiques basés sur des données brutes décrivant l’activité de vote d’une population de représentants parlementaires. Extraire les réseaux de vote à partir de ces données. Effectuer diverses analyses sur ces réseaux, notamment : estimer de bonnes partitions de l’ensemble des nœuds selon différentes mesures. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement Européen (MEP) lors de la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont d’abord été récupérées sur le site de VoteWatch. Cependant, ces données étaient incomplètes, donc nous avons ensuite basculé vers une autre source : le site It’s Your Parliament. Il y avait aussi quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées sont disponibles sur Zenodo ici et là. URL : https://github.com/CompNet/NetVotes Date de production : 2014–2018 Publications liées : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Signed Graph Analysis for theInterpretation of Voting Behavior ». In Plus d'infos

Rectitude & graphes spatiaux

3 décembre 2016

Ces scripts ont été conçus pour calculer plusieurs variantes de la Rectitude (également désignée sous de nombreux autres noms) : le rapport entre la distance euclidienne et la distance sur le graphe. C’est une mesure conçue pour étudier les graphes spatiaux, c’est-à-dire des graphes définis dans un espace euclidien (les nœuds ont des positions spatiales, les liens ont des longueurs, etc.). Les scripts peuvent calculer la Rectitude en utilisant l’approche traditionnelle, c’est-à-dire en ne considérant que les chemins reliant deux nœuds. Elle peut calculer la Rectitude entre deux nœuds spécifiques, ou la Rectitude moyennée sur certaines paires de nœuds dans le graphe (éventuellement toutes). Les scripts permettent également de calculer la Rectitude moyenne à travers une approche continue (par opposition à l’approche discrète traditionnelle), et incidemment, c’est le point abordé dans l’article ci-dessous. URL : https://github.com/CompNet/SpatialMeasures Date de production : 2016 Publication liée :  Vincent Labatut. « Continuous Average Straightness in Spatial Graphs ». In : Journalof Complex Networks 6(2):269-296 (2018). DOI: 10.1093/comnet/cnx033. ⟨hal-01571212⟩

Centralité basée sur la diffusion d’opinion dans les réseaux multiplexes

3 décembre 2016

Ces scripts ont été conçus dans deux buts : Calculer la centralité d’opinion, une nouvelle mesure de centralité pour les réseaux multiplexes. La comparer à d’autres mesures de centralité multiplexe existantes. Nos scripts ont été appliqués à une collection de réseaux multiplexes obtenus à partir de sources publiques et fournis dans notre dépôt GitHub. L’outil lui-même, les données et les résultats expérimentaux sont tous décrits dans l’article ci-dessous. URL : https://github.com/CompNet/MultiplexCentrality Date de production : 2015–2016 Publication liée :  Alexandre Reiffers et Vincent Labatut. « Opinion-based centrality in multiplexnetworks : A convex optimization approach ». In : Network Science 5(2):213-234 (2017). DOI: 10.1017/nws.2017.7. ⟨hal-01486629⟩  (article à citer si vous utilisez le logiciel)

1 2