Soutenance de thèse de Carlos González – 18 décembre 2019

16 décembre 2019

Soutenance de thèse de Carlos González intitulée « Résumé automatique multimédia et multilingue et Recherche d’information » le mercredi 18 décembre 2019 à 14H00 dans la Salle de thèses (Saint Marthe – Centre Ville). Jury : Mme Violaine PRINCE Professeur, LIRMM, Montpellier 2 Rapportrice M. Eric GAUSSIER Professeur, LIG, Grenoble Rapporteur Mme. Fatiha SADAT Professeur, GDAC, Montréal Examinatrice M. Laurent BESACIER Professeur, LIG, Grenoble Examinateur M. Kamel SMAILI Professeur, LORIA, CNRS-Lorraine-Inria Examinateur M. Alfonso MEDINA URREA Chercheur, CELL, COLMEX Examinateur M. Juan-Manuel TORRES-MORENO Maître de Conférence HDR, LIA, Avignon Directeur M. Eric SANJUAN Maître de Conférence HDR, LIA, Avignon Co-directeur Résumé : Alors que les sources multimédias sont massivement disponibles en ligne, aider les utilisateurs à comprendre la grande quantité d’information générée est devenu un problème majeur. Une façon de procéder consiste à résumer le contenu multimédia, générant ainsi des versions abrégées et informatives des sources. Cette thèse aborde le sujet du résumé automatique (texte et parole) dans un contexte multilingue. Elle a été réalisée dans le cadre du projet CHISTERA-ANR Accès multilingue à l’information (AMIS). Le résumé multimédia basé sur le texte utilise des transcriptions pour produire des résumés qui peuvent être présentés sous forme textuelle ou dans leur format Plus d'infos

Partitionnement multiple de réseaux signés multiplexes

4 décembre 2019

Ces scripts ont été conçus pour analyser les votes du Parlement européen à travers une approche basée sur les réseaux multiplexes. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement européen (MEP) pendant la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont été récupérées sur le site It’s Your Parliament. Il y avait quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées, ainsi que nos figures et résultats, sont disponibles sur Zenodo. URL : https://github.com/CompNet/MultiNetVotes Date de production : 2018–2019 Publications liées :  Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple partitioning of multiplexsigned networks : Application to European parliament votes ». In : Social Networks60:83-102 (2020). DOI: 10.1016/j.socnet.2019.02.001. ⟨hal-02082574⟩ (article à citer si vous utilisez ce logiciel) Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple Partitioning of MultiplexSigned Networks ». In : 21ème Congrès Annuel de la Société Française de RechercheOpérationnelle et d’Aide à la Décision (ROADEF). Montpellier, FR, 2020. ROADEF ⟨hal-02428300⟩    

Projet ANR DéCoMaP

1 septembre 2019

L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C’est en particulier vrai des données des marchés publics, aujourd’hui disponibles, et sur lesquelles est fondé l’espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l’efficacité du droit. Alliant Informatique, Économie et Droit, DéCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention. Plus d'infos

Génération aléatoire de graphes signés

3 décembre 2018

Ces scripts ont été conçus pour générer aléatoirement des graphes signés possédant un certain type de structure de communautés, dans le but d’évaluer des algorithmes de partitionnement. Divers aspects des graphes peuvent être spécifiés par l’utilisateur. URL : https://github.com/CompNet/SignedBenchmark Date de production : 2017–2018 Publication liée : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiplicity and Diversity :Analyzing the Optimal Solution Space of the Correlation Clustering Problem onComplete Signed Graphs ». In : Journal of Complex Networks 8(6):cnaa025 (2020).DOI: 10.1093/comnet/cnaa025. ⟨hal-02994011⟩

Détection d’évènements sur le Web pour la Science Politique

3 décembre 2018

Ce logiciel prend le nom d’une personne publique et une période, et récupère tous les événements disponibles en ligne impliquant cette personne pendant cette période. Il effectue d’abord une recherche Web en utilisant divers moteurs, puis récupère les pages Web correspondantes, réalise une reconnaissance d’entités nommées (NER), utilise ces entités pour clusteriser les articles et considère chaque cluster comme la description d’un événement spécifique. Il est conçu pour gérer les pages Web en français, mais devrait également fonctionner pour l’anglais. URL : https://github.com/CompNet/TranspoloSearch Date de production : 2015–2018 Publications liées : Vincent Labatut et Guillaume Marrel. « La visibilité politique en ligne : Contributionà la mesure de l’e-reputation politique d’un maire urbain ». In : Big Data etvisibilité en ligne : Un enjeu pluridisciplinaire de l’économie numérique. Fort-de-France,FR, 2017, p. 271-286. ⟨hal-01904352⟩ Guillaume Marrel, Vincent Labatut et Marc El Bèze. « Le Web comme miroir dutravail politique quotidien? Reconstituer l’écho médiatique en ligne des événementsd’un agenda d’élu ». In : 13ème Congrès de l’Association Française de Science Politique(AFSP). Aix-en-Provence, FR, 2015, p. 25. AFSP ⟨hal-01904338⟩

Extraction et partitionnement de réseaux de votes

2 décembre 2018

Ces scripts ont été conçus dans trois objectifs : Générer une variété de graphiques et de statistiques basés sur des données brutes décrivant l’activité de vote d’une population de représentants parlementaires. Extraire les réseaux de vote à partir de ces données. Effectuer diverses analyses sur ces réseaux, notamment : estimer de bonnes partitions de l’ensemble des nœuds selon différentes mesures. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement Européen (MEP) lors de la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont d’abord été récupérées sur le site de VoteWatch. Cependant, ces données étaient incomplètes, donc nous avons ensuite basculé vers une autre source : le site It’s Your Parliament. Il y avait aussi quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées sont disponibles sur Zenodo ici et là. URL : https://github.com/CompNet/NetVotes Date de production : 2014–2018 Publications liées : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Signed Graph Analysis for theInterpretation of Voting Behavior ». In Plus d'infos

Rectitude & graphes spatiaux

3 décembre 2016

Ces scripts ont été conçus pour calculer plusieurs variantes de la Rectitude (également désignée sous de nombreux autres noms) : le rapport entre la distance euclidienne et la distance sur le graphe. C’est une mesure conçue pour étudier les graphes spatiaux, c’est-à-dire des graphes définis dans un espace euclidien (les nœuds ont des positions spatiales, les liens ont des longueurs, etc.). Les scripts peuvent calculer la Rectitude en utilisant l’approche traditionnelle, c’est-à-dire en ne considérant que les chemins reliant deux nœuds. Elle peut calculer la Rectitude entre deux nœuds spécifiques, ou la Rectitude moyennée sur certaines paires de nœuds dans le graphe (éventuellement toutes). Les scripts permettent également de calculer la Rectitude moyenne à travers une approche continue (par opposition à l’approche discrète traditionnelle), et incidemment, c’est le point abordé dans l’article ci-dessous. URL : https://github.com/CompNet/SpatialMeasures Date de production : 2016 Publication liée :  Vincent Labatut. « Continuous Average Straightness in Spatial Graphs ». In : Journalof Complex Networks 6(2):269-296 (2018). DOI: 10.1093/comnet/cnx033. ⟨hal-01571212⟩

Centralité basée sur la diffusion d’opinion dans les réseaux multiplexes

3 décembre 2016

Ces scripts ont été conçus dans deux buts : Calculer la centralité d’opinion, une nouvelle mesure de centralité pour les réseaux multiplexes. La comparer à d’autres mesures de centralité multiplexe existantes. Nos scripts ont été appliqués à une collection de réseaux multiplexes obtenus à partir de sources publiques et fournis dans notre dépôt GitHub. L’outil lui-même, les données et les résultats expérimentaux sont tous décrits dans l’article ci-dessous. URL : https://github.com/CompNet/MultiplexCentrality Date de production : 2015–2016 Publication liée :  Alexandre Reiffers et Vincent Labatut. « Opinion-based centrality in multiplexnetworks : A convex optimization approach ». In : Network Science 5(2):213-234 (2017). DOI: 10.1017/nws.2017.7. ⟨hal-01486629⟩  (article à citer si vous utilisez le logiciel)

Génération et analyse de graphes spatiaux

2 décembre 2016

Ces scripts ont été conçus pour générer différents types de graphes spatiaux et calculer certaines propriétés topologiques. Plus précisément, l’objectif ici est d’étudier les réseaux dits orbitèles, qui imitent les toiles d’araignées typiques, en mettant l’accent sur la mesure de Rectitude. URL : https://github.com/geomatique/SpiderNet Date de production : 2014–2016 Publications liées :  Didier Josselin, Vincent Labatut et Dieter Mitsche. « Straightness of rectilinear vs.radio-concentric networks : modeling, simulation and comparison ». In : 7th AnnualSymposium on Simulation for Architecture and Urban Design (SimAUD). London, UK,2016, p. 95-102. SimAUD ⟨hal-01367824⟩ (article à citer si vous utilisez ce logiciel) Didier Josselin, Sonia Chekir, Alain Pasquet, Vincent Labatut, Yvan Capowiez,Christophe Mazzia, Yezekael Hayel, Adrien Lammoglia, Cyrille Genre-Grandpierre,Dieter Mitsche et Frédéric Patras. « Modélisation, simulation et analyse de propriétésde réseaux orbitèles ». In : Revue Internationale de Géomatique / International Journalof Geomatics and Spatial Analysis 25(4):515-536 (2015). DOI: 10.3166/RIG.25.515-536. ⟨hal-01249881⟩  

Prédiction de l’influence hors ligne à partir de l’activité en ligne

2 décembre 2015

Ces scripts sont destinés à extraire certaines caractéristiques à partir de données brutes de Twitter décrivant les utilisateurs (tweets, informations de profil ainsi que des données externes). Une fois les caractéristiques extraites, différentes formes de SVM (machines à vecteurs de support) sont entraînées et des régressions logistiques sont effectuées pour classifier ces utilisateurs. Ces opérations sont menées sur différents sous-groupes de caractéristiques. Les détails du processus sont donnés dans les publications ci-dessous. Les scripts ont été appliqués à la classification des utilisateurs de Twitter en termes d’influence hors ligne, sur la base du jeu de données RepLab 2014. URL : https://github.com/CompNet/Influence Date de production : 2014–2015 Publications liées : Jean-Valère Cossu, Vincent Labatut et Nicolas Dugué. « A Review of Featuresfor the Discrimination of Twitter Users : Application to the Prediction of OfflineInfluence ». In : Social Network Analysis and Mining (SNAM) 6:25 (2016). DOI:10.1007/s13278-016-0329-x. ⟨hal-01203171⟩ Jean-Valère Cossu, Nicolas Dugué et Vincent Labatut. « Detecting Real-WorldInfluence Through Twitter ». In : 2nd European Network Intelligence Conference (ENIC).Karlskrona, SE : IEEE Publishing, 2015, p. 83-90. DOI: 10.1109/ENIC.2015.20.⟨hal-01164453⟩ (publication à citer si vous utilisez ce code source)

1 5 6 7 8