Soutenance de thèse de Mayeul Matthias – 22 janvier 2021

22 janvier 2021

Le 22 Janvier 2021, Mayeul Matthias soutiendra sa thèse intitulée  « Recommandation de parcours culturels personnalisés-Étude interdisciplinaire de la proposition automatique de visites ». Cette thèse est dirigée par Juan-Manuel Torres et Didier Josselin, et co-encadrée par Fen Zhou.  Le jury est composé de: Patrice BELLOT – Aix-Marseille Université,  LIS (Rapporteur) Sébastien MUSTIÈRE – Université Gustave-Eiffel/ENSG, IGN (Rapporteur) Marie-Sylvie POLI – Avignon Université,  LCC (Examinatrice) Enrico NATALIZIO – Université de Lorraine, LORIA (Examinateur) Francesco DE PELLEGRINI – Avignon Université, LIA (Président) Juan-Manuel TORRES-MORENO (Directeur) Didier JOSSELIN – Avignon Université,  ESPACE (Co-directeur) Fen ZHOU (Co-Encadrant) Résumé : Cette thèse s’intéresse à la recommandation de visites culturelles à travers une approche interdisciplinaire. Ces travaux mêlent des techniques issues de la RechercheOpérationnelle et du traitement automatique de la langue naturelle écrite tout en se basant sur des concepts issus de la sociologie des publics et de la géographie. Nous proposonsde nouvelles méthodes autour de l’évaluation des points d’intérêt culturel ainsi que la création automatique de parcours touristiques prenant en compte les envies expriméespar un visiteur. Ces principes sont appliqués à deux échelles et contextes différents, la visite de musées et les parcours culturels dans une ville. Dans une première partie, nous nous concentrons sur les Plus d'infos

WAC – Wikipedia Abusive Conversations

4 décembre 2020

Ce jeu de données contient des conversations entre les éditeurs de Wikipedia, annotées en termes de divers types d’abus, au niveau des messages. Il aligne deux corpus existants : Les messages et les structures de conversation de WikiConv (https://github.com/conversationai/wikidetox/tree/master/wikiconv) Les annotations manuelles de toxicité de Wikipedia Comment Corpus (WCC — https://doi.org/10.6084/m9.figshare.4054689)   URL : https://zenodo.org/doi/10.5281/zenodo.6817092 Date de production : 2019–2020 Publication liée :  Noé Cécillon, Vincent Labatut, Richard Dufour et Georges Linarès, “WAC: A Corpus of Wikipedia Conversations for Online Abuse Detection,” in 12th Language Resources and Evaluation Conference (LREC), 2020, pp. 1375–1383. LREC ⟨hal-02497514⟩

Réseau social de l’empereur Trajan

4 décembre 2020

Ces scripts visent à analyser un ensemble de données historiques décrivant les relations entre l’empereur romain Trajan et son entourage. Ils réalisent ce qui suit : Extraction de divers réseaux à partir de données tabulaires contenant des attributs individuels et relationnels issus des sources historiques. Calcul de statistiques et génération des graphiques correspondants, pour les tables et les graphes. Analyse séquentielle de certains attributs chronologiques.   URL : https://github.com/CompNet/TrajanNet Publication date: 2019–2020

Soutenance de thèse Cyril Sahuc – 1er décembre 2020

1 décembre 2020

Le 01/12/2020 à 14h dans la salle de réunion du LIA. Titre : Approches mathématiques pour l’aménagement de zones commerciales : modèles linéaires, algorithmes et systèmes multi-agents.   Thèse en collaboration avec Cyrille Genre-Grandpierre (UMR Espace) dans le cadre d’une bourse régionale industrielle.   Compte tenu de la situation, la soutenance est à distance (comme toutes les thèses actuellement). 

Soutenance de thèse de Carlos González – 18 décembre 2019

16 décembre 2019

Soutenance de thèse de Carlos González intitulée « Résumé automatique multimédia et multilingue et Recherche d’information » le mercredi 18 décembre 2019 à 14H00 dans la Salle de thèses (Saint Marthe – Centre Ville). Jury : Mme Violaine PRINCE Professeur, LIRMM, Montpellier 2 Rapportrice M. Eric GAUSSIER Professeur, LIG, Grenoble Rapporteur Mme. Fatiha SADAT Professeur, GDAC, Montréal Examinatrice M. Laurent BESACIER Professeur, LIG, Grenoble Examinateur M. Kamel SMAILI Professeur, LORIA, CNRS-Lorraine-Inria Examinateur M. Alfonso MEDINA URREA Chercheur, CELL, COLMEX Examinateur M. Juan-Manuel TORRES-MORENO Maître de Conférence HDR, LIA, Avignon Directeur M. Eric SANJUAN Maître de Conférence HDR, LIA, Avignon Co-directeur Résumé : Alors que les sources multimédias sont massivement disponibles en ligne, aider les utilisateurs à comprendre la grande quantité d’information générée est devenu un problème majeur. Une façon de procéder consiste à résumer le contenu multimédia, générant ainsi des versions abrégées et informatives des sources. Cette thèse aborde le sujet du résumé automatique (texte et parole) dans un contexte multilingue. Elle a été réalisée dans le cadre du projet CHISTERA-ANR Accès multilingue à l’information (AMIS). Le résumé multimédia basé sur le texte utilise des transcriptions pour produire des résumés qui peuvent être présentés sous forme textuelle ou dans leur format Plus d'infos

Partitionnement multiple de réseaux signés multiplexes

4 décembre 2019

Ces scripts ont été conçus pour analyser les votes du Parlement européen à travers une approche basée sur les réseaux multiplexes. Notre outil a été appliqué à des données représentant l’activité des membres du Parlement européen (MEP) pendant la 7e législature (de juin 2009 à juin 2014). Les données brutes décrivant cette activité ont été récupérées sur le site It’s Your Parliament. Il y avait quelques problèmes mineurs avec ces données, que nous avons dû corriger : certains MEP étaient représentés deux fois, certains profils étaient incomplets, les domaines politiques n’étaient pas définis pour tous les textes de vote, etc. Ces données nettoyées, ainsi que nos figures et résultats, sont disponibles sur Zenodo. URL : https://github.com/CompNet/MultiNetVotes Date de production : 2018–2019 Publications liées :  Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple partitioning of multiplexsigned networks : Application to European parliament votes ». In : Social Networks60:83-102 (2020). DOI: 10.1016/j.socnet.2019.02.001. ⟨hal-02082574⟩ (article à citer si vous utilisez ce logiciel) Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiple Partitioning of MultiplexSigned Networks ». In : 21ème Congrès Annuel de la Société Française de RechercheOpérationnelle et d’Aide à la Décision (ROADEF). Montpellier, FR, 2020. ROADEF ⟨hal-02428300⟩    

Projet ANR DéCoMaP

1 septembre 2019

L’ouverture massive des données publiques recouvre une importance économique et sociétale considérable. C’est en particulier vrai des données des marchés publics, aujourd’hui disponibles, et sur lesquelles est fondé l’espoir de découvrir et de combattre les phénomènes de fraudes et de corruption qui y sont malheureusement massivement présents ; et ce en permettant de mettre en lumière les informations critiques et de développer des outils améliorant l’efficacité du droit. Alliant Informatique, Économie et Droit, DéCoMap vise ainsi à collecter, traiter et analyser ces données relatives aux marchés publics français, afin d’élaborer des outils de détection automatique des risques de corruption et de fraude et de proposer une grille d’analyse normative mettant en évidence les principaux facteurs de risques que le législateur devrait identifier et sur lesquels les autorités de contrôle devraient porter leur attention. Plus d'infos

Génération aléatoire de graphes signés

3 décembre 2018

Ces scripts ont été conçus pour générer aléatoirement des graphes signés possédant un certain type de structure de communautés, dans le but d’évaluer des algorithmes de partitionnement. Divers aspects des graphes peuvent être spécifiés par l’utilisateur. URL : https://github.com/CompNet/SignedBenchmark Date de production : 2017–2018 Publication liée : Nejat Arınık, Rosa Figueiredo et Vincent Labatut. « Multiplicity and Diversity :Analyzing the Optimal Solution Space of the Correlation Clustering Problem onComplete Signed Graphs ». In : Journal of Complex Networks 8(6):cnaa025 (2020).DOI: 10.1093/comnet/cnaa025. ⟨hal-02994011⟩

Détection d’évènements sur le Web pour la Science Politique

3 décembre 2018

Ce logiciel prend le nom d’une personne publique et une période, et récupère tous les événements disponibles en ligne impliquant cette personne pendant cette période. Il effectue d’abord une recherche Web en utilisant divers moteurs, puis récupère les pages Web correspondantes, réalise une reconnaissance d’entités nommées (NER), utilise ces entités pour clusteriser les articles et considère chaque cluster comme la description d’un événement spécifique. Il est conçu pour gérer les pages Web en français, mais devrait également fonctionner pour l’anglais. URL : https://github.com/CompNet/TranspoloSearch Date de production : 2015–2018 Publications liées : Vincent Labatut et Guillaume Marrel. « La visibilité politique en ligne : Contributionà la mesure de l’e-reputation politique d’un maire urbain ». In : Big Data etvisibilité en ligne : Un enjeu pluridisciplinaire de l’économie numérique. Fort-de-France,FR, 2017, p. 271-286. ⟨hal-01904352⟩ Guillaume Marrel, Vincent Labatut et Marc El Bèze. « Le Web comme miroir dutravail politique quotidien? Reconstituer l’écho médiatique en ligne des événementsd’un agenda d’élu ». In : 13ème Congrès de l’Association Française de Science Politique(AFSP). Aix-en-Provence, FR, 2015, p. 25. AFSP ⟨hal-01904338⟩

1 5 6 7 8