Projet ANR DéCoMaP

1 septembre 2019

L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C’est en particulier vrai des données des marchés publics, aujourd’hui disponibles, et sur lesquelles est fondé l’espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l’efficacité du droit. Alliant Informatique, Économie et Droit, DéCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention. Plus d'infos

Génération aléatoire de graphes signés

3 décembre 2018

Ces scripts ont été conçus pour générer aléatoirement des graphes signés possédant un certain type de structure de communautés, dans le but d’évaluer des algorithmes de partitionnement. Divers aspects des graphes peuvent être spécifiés par l’utilisateur. URL : https://github.com/CompNet/SignedBenchmark Date de production : 2017–2018 Publication liée : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiplicity and Diversity :Analyzing the Optimal Solution Space of the Correlation Clustering Problem onComplete Signed Graphs ». In : Journal of Complex Networks 8(6):cnaa025 (2020).DOI: 10.1093/comnet/cnaa025. ⟨hal-02994011⟩

Détection d’évènements sur le Web pour la Science Politique

3 décembre 2018

Ce logiciel prend le nom d’une personne publique et une période, et récupère tous les événements disponibles en ligne impliquant cette personne pendant cette période. Il effectue d’abord une recherche Web en utilisant divers moteurs, puis récupère les pages Web correspondantes, réalise une reconnaissance d’entités nommées (NER), utilise ces entités pour clusteriser les articles et considère chaque cluster comme la description d’un événement spécifique. Il est conçu pour gérer les pages Web en français, mais devrait également fonctionner pour l’anglais. URL : https://github.com/CompNet/TranspoloSearch Date de production : 2015–2018 Publications liées : Vincent Labatut et Guillaume Marrel. « La visibilité politique en ligne : Contributionà la mesure de l’e-reputation politique d’un maire urbain ». In : Big Data etvisibilité en ligne : Un enjeu pluridisciplinaire de l’économie numérique. Fort-de-France,FR, 2017, p. 271-286. ⟨hal-01904352⟩ Guillaume Marrel, Vincent Labatut et Marc El Bèze. « Le Web comme miroir dutravail politique quotidien? Reconstituer l’écho médiatique en ligne des événementsd’un agenda d’élu ». In : 13ème Congrès de l’Association Française de Science Politique(AFSP). Aix-en-Provence, FR, 2015, p. 25. AFSP ⟨hal-01904338⟩

Extraction et partitionnement de réseaux de votes

2 décembre 2018

Ces scripts ont été conçus dans trois objectifs : Générer une variété de graphiques et de statistiques basés sur des données brutes décrivant l’activité de vote d’une population de représentants parlementaires. Extraire les réseaux de vote à partir de ces données. Effectuer diverses analyses sur ces réseaux, notamment : estimer de bonnes partitions de l’ensemble des nœuds selon différentes mesures. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement Européen (MEP) lors de la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont d’abord été récupérées sur le site de VoteWatch. Cependant, ces données étaient incomplètes, donc nous avons ensuite basculé vers une autre source : le site It’s Your Parliament. Il y avait aussi quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées sont disponibles sur Zenodo ici et là. URL : https://github.com/CompNet/NetVotes Date de production : 2014–2018 Publications liées : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Signed Graph Analysis for theInterpretation of Voting Behavior ». In Plus d'infos

Rectitude & graphes spatiaux

3 décembre 2016

Ces scripts ont été conçus pour calculer plusieurs variantes de la Rectitude (également désignée sous de nombreux autres noms) : le rapport entre la distance euclidienne et la distance sur le graphe. C’est une mesure conçue pour étudier les graphes spatiaux, c’est-à-dire des graphes définis dans un espace euclidien (les nœuds ont des positions spatiales, les liens ont des longueurs, etc.). Les scripts peuvent calculer la Rectitude en utilisant l’approche traditionnelle, c’est-à-dire en ne considérant que les chemins reliant deux nœuds. Elle peut calculer la Rectitude entre deux nœuds spécifiques, ou la Rectitude moyennée sur certaines paires de nœuds dans le graphe (éventuellement toutes). Les scripts permettent également de calculer la Rectitude moyenne à travers une approche continue (par opposition à l’approche discrète traditionnelle), et incidemment, c’est le point abordé dans l’article ci-dessous. URL : https://github.com/CompNet/SpatialMeasures Date de production : 2016 Publication liée :  Vincent Labatut. « Continuous Average Straightness in Spatial Graphs ». In : Journalof Complex Networks 6(2):269-296 (2018). DOI: 10.1093/comnet/cnx033. ⟨hal-01571212⟩

Centralité basée sur la diffusion d’opinion dans les réseaux multiplexes

3 décembre 2016

Ces scripts ont été conçus dans deux buts : Calculer la centralité d’opinion, une nouvelle mesure de centralité pour les réseaux multiplexes. La comparer à d’autres mesures de centralité multiplexe existantes. Nos scripts ont été appliqués à une collection de réseaux multiplexes obtenus à partir de sources publiques et fournis dans notre dépôt GitHub. L’outil lui-même, les données et les résultats expérimentaux sont tous décrits dans l’article ci-dessous. URL : https://github.com/CompNet/MultiplexCentrality Date de production : 2015–2016 Publication liée :  Alexandre Reiffers et Vincent Labatut. « Opinion-based centrality in multiplexnetworks : A convex optimization approach ». In : Network Science 5(2):213-234 (2017). DOI: 10.1017/nws.2017.7. ⟨hal-01486629⟩  (article à citer si vous utilisez le logiciel)

Génération et analyse de graphes spatiaux

2 décembre 2016

Ces scripts ont été conçus pour générer différents types de graphes spatiaux et calculer certaines propriétés topologiques. Plus précisément, l’objectif ici est d’étudier les réseaux dits orbitèles, qui imitent les toiles d’araignées typiques, en mettant l’accent sur la mesure de Rectitude. URL : https://github.com/geomatique/SpiderNet Date de production : 2014–2016 Publications liées :  Didier Josselin, Vincent Labatut et Dieter Mitsche. « Straightness of rectilinear vs.radio-concentric networks : modeling, simulation and comparison ». In : 7th AnnualSymposium on Simulation for Architecture and Urban Design (SimAUD). London, UK,2016, p. 95-102. SimAUD ⟨hal-01367824⟩ (article à citer si vous utilisez ce logiciel) Didier Josselin, Sonia Chekir, Alain Pasquet, Vincent Labatut, Yvan Capowiez,Christophe Mazzia, Yezekael Hayel, Adrien Lammoglia, Cyrille Genre-Grandpierre,Dieter Mitsche et Frédéric Patras. « Modélisation, simulation et analyse de propriétésde réseaux orbitèles ». In : Revue Internationale de Géomatique / International Journalof Geomatics and Spatial Analysis 25(4):515-536 (2015). DOI: 10.3166/RIG.25.515-536. ⟨hal-01249881⟩  

Prédiction de l’influence hors ligne à partir de l’activité en ligne

2 décembre 2015

Ces scripts sont destinés à extraire certaines caractéristiques à partir de données brutes de Twitter décrivant les utilisateurs (tweets, informations de profil ainsi que des données externes). Une fois les caractéristiques extraites, différentes formes de SVM (machines à vecteurs de support) sont entraînées et des régressions logistiques sont effectuées pour classifier ces utilisateurs. Ces opérations sont menées sur différents sous-groupes de caractéristiques. Les détails du processus sont donnés dans les publications ci-dessous. Les scripts ont été appliqués à la classification des utilisateurs de Twitter en termes d’influence hors ligne, sur la base du jeu de données RepLab 2014. URL : https://github.com/CompNet/Influence Date de production : 2014–2015 Publications liées : Jean-Valère Cossu, Vincent Labatut et Nicolas Dugué. « A Review of Featuresfor the Discrimination of Twitter Users : Application to the Prediction of OfflineInfluence ». In : Social Network Analysis and Mining (SNAM) 6:25 (2016). DOI:10.1007/s13278-016-0329-x. ⟨hal-01203171⟩ Jean-Valère Cossu, Nicolas Dugué et Vincent Labatut. « Detecting Real-WorldInfluence Through Twitter ». In : 2nd European Network Intelligence Conference (ENIC).Karlskrona, SE : IEEE Publishing, 2015, p. 83-90. DOI: 10.1109/ENIC.2015.20.⟨hal-01164453⟩ (publication à citer si vous utilisez ce code source)

Capitalistes sociaux & rôles communautaires

2 décembre 2014

Ce logiciel vise à étudier les capitalistes sociaux, qui constituent un type spécifique d’utilisateurs de services de réseaux sociaux tels que Twitter. L’outil est générique, il peut donc être appliqué à des systèmes complètement différents, tant qu’ils peuvent être représentés sous forme de réseaux orientés (c’est-à-dire des digraphes). Nous avons appliqué notre outil à Twitter dans plusieurs articles de recherche, détaillés ci-dessous. Notre travail a également été mentionné sur le blog MIT Technology review. URL : https://github.com/CompNet/Orleans Date de production : 2013–2014 Publications liées : Nicolas Dugué, Vincent Labatut et Anthony Perez. « A Community Role ApproachTo Assess Social Capitalists Visibility in the Twitter Network ». In : Social NetworkAnalysis and Mining (SNAM) 5:26 (2015), p. 26. DOI: 10.1007/s13278-015-0266-0.⟨hal-01163741⟩ Nicolas Dugué, Vincent Labatut et Anthony Perez. « Identifying the CommunityRoles of Social Capitalists in the Twitter Network ». In : IEEE/ACM InternationalConference on Advances in Social Network Analysis and Mining (ASONAM). Beijing,CN : IEEE Publishing, 2014, p. 371-374. DOI: 10.1109/ASONAM.2014.6921612.⟨hal-01011910⟩ (publication à citer si vous utilisez ce logiciel) Nicolas Dugué, Vincent Labatut et Anthony Perez. « Identification de rôles communautairesdans des réseaux orientés, appliquée à Twitter ». In : 14ème ConférenceExtraction et Gestion des Connaissances (EGC). Rennes, FR, 2014, p. Plus d'infos

Mesures topologiques pour l’évaluation de la détection de communautés

2 décembre 2013

Ces scripts implémentent plusieurs mesures permettant de comparer deux structures de communautés, c’est-à-dire deux partitions de l’ensemble des nœuds d’un graphe donné. Elles se basent sur des mesures populaires définies dans le domaine de l’analyse de clusters, à savoir : Pureté (également connue sous de nombreux autres noms dans la littérature, tels que pourcentage correct, précision, etc.) Indice de Rand et sa version ajustée. Information mutuelle normalisée. Les variantes implémentées ici tiennent compte de la structure du réseau, un aspect essentiel de la structure communautaire qui est sinon complètement ignoré dans les mesures standard. URL : https://github.com/CompNet/TopoMeasures Date de production : 2012–2016 Publications liées : Vincent Labatut. « Generalized Measures for the Evaluation of Community DetectionMethods ». In : International Journal of Social Network Mining (IJSNM) 2(1):44-63(2015). DOI: 10.1504/IJSNM.2015.069776. ⟨hal-00802923⟩ (article à citer si vous utilisez ce logiciel) Vincent Labatut. « Une nouvelle mesure pour l’évaluation des méthodes de détectionde communautés ». In : 3ème Conférence sur les modèles et l’analyse de réseaux : approches mathématiques et informatiques (MARAMI). Villetaneuse, FR, 2012, 12p. MARAMI ⟨hal-00743888⟩

1 4 5 6