Séminaire Cornet – Judith Agueda Roldan Ahumada – 15/03/2024

12 mars 2024

Dans le cadre des séminaires de l’équipe Cornet, Judith Agueda Roldan Ahumada (Universidad Veracruzana) présentera son travail de recherche intitulé Modeling and optimization of a vehicle routing problem in a coffee company, le 14 mars 2024 à 11h35 en salle de réunion. Résumé : Dans la région centrale de Veracruz, au Mexique, compte tenu des conditions météorologiques et des sols, différentes entreprises se consacrent à la production de café. Pour mener à bien les différentes activités telles que la plantation, la récolte, le nettoyage, entre autres, il est nécessaire de transporter les récolteurs vers différents terrains agricoles ; généralement, ce problème logistique est résolu de manière empirique sans considérer le coût par transfert. Le problème, qui sera présenté, est né de la nécessité de résoudre un problème de logistique de transport pour une entreprise de café dans la région centrale de Veracruz. Nous considérons un seul véhicule avec une capacité maximale de N articles, le véhicule commence le trajet sans articles depuis un parking et peut collecter les articles dans des endroits situés le long du chemin, allant du parking à l’endroit où les articles sont livrés (terres agricoles). Les endroits sont ordonnés de manière consécutive, de sorte que, une Plus d'infos

Séminaire SLG – Antoine Caubrière – 15/03/2024

11 mars 2024

Le prochain séminaire de l’équipe SLG aura lieu le 15/03/2024, entre 10h et 11h. Nous recevrons Antoine Caubrière, de l’entreprise Orange, qui présentera ses travaux récents. Titre : Représentation de la parole multilingue par apprentissage auto-supervisé dans un contexte exclusivement sub-saharien. Résumé : Le groupe Orange est présent dans plus d’une dizaine de pays d’Afrique subsaharienne avec une ambition d’avoir des offres en phase avec les besoins des clients sur cette zone. Pour fournir des services localisés et accessibles aux personnes peu digitalisées et peu lettrées, Orange mise sur le développement d’agents conversationnels vocaux, permettant d’informer et d’accompagner ses clients et collaborateurs. La mise en œuvre d’un tel service nécessite en premier lieu une brique technologique de reconnaissance et compréhension de la parole. La diversité linguistique forte du continent africain associée aux problématiques de faible volume de données annotées disponible, constitue un des chalenges de la mise en œuvre de technologie de traitement de la parole pour ces langues. Une des solutions peut être l’exploitation des techniques d’apprentissage par auto-supervision. Exploiter cet apprentissage permet l’entraînement d’un extracteur de représentation riche de la parole. Ce type d’approche utilise une grande quantité de données non transcrites pour le pré-entrainement d’un modèle avant Plus d'infos

Allocation doctorale LIA 2024

27 février 2024

L’allocation doctorale 2024 du LIA a été attribuée à l’équipe Cornet. Plusieurs sujets ont été proposés, ils sont disponibles sur la plateforme Adum. Par ordre alphabétique de titre : Les candidats et candidates intéressées doivent postuler sur la plateforme Adum. Surtout, avant cela, contactez les chercheurs et chercheuses qui proposent les sujets, afin d’en discuter avec eux et elles.

Poste MCF 27 à l’IUT d’Avignon

27 février 2024

Dans le cadre de la campagne synchronisée de recrutement des enseignants-chercheurs et enseignantes-chercheuses 2024, Avignon Université propose un poste de MCF en section 27. L’enseignement se déroulera à l’IUT d’Avignon en BUT Science des données, et la recherche au Laboratoire Informatique d’Avignon (LIA). La fiche du poste est disponible ici : https://univ-avignon.fr/wp-content/uploads/2024/02/4222-IUT-MCF-27.pdf

Séminaire Cornet – 23/02/2024

20 février 2024

Le prochain séminaire de l’équipe Cornet aura lieu le 23 février 2024 à 11h35 en S3, et comportera deux parties. Dans un premier temps, Sylvie Chaddad (LIA) présentera son sujet de thèse portant sur Stochastic Control for Optimizing Crowdfunding Project Dynamics. Puis, Lorena Garrido (Université de Veracruz) présentera son travail intitulé On the Monge-Kantorovich divergence. Résumé : La divergence de Monge-Kantorovich est une mesure de proximité entre distributions de probabilité. Historiquement, elle provient d’un problème de transport optimal de mouvement de sable, dans le domaine du génie civil. Aujourd’hui, le problème de Monge-Kantorovich a donné lieu à de nombreuses études théoriques, ainsi qu’à diverses applications, y compris l’analyse de données. Dans cette présentation, quelques applications en analyse de données seront mentionnées.

Best paper award

19 février 2024

Félicitations à Grace Tessa Masse et Abderrahim Benslimane, pour le best paper award qu’ils ont obtenu à International Conference on Computing, Networking and Communications (IEEE ICNC 2024) Titre: A Secure Hierarchical Federated Learning Using Dirichlet-based Trust Management Abstract—Hierarchical Federated Learning (HFL) is a distributed machine learning training system in which a server works with several clients and edge nodes while maintaining data privacy. Distributed machine learning training systems are also known as Federated Learning, but HFL is a type of Federated Learning that utilizes a hierarchical network architecture to address computational issues when dealing with a high number of clients. However, HFL is vulnerable to attacks such as data poisoning, which may jeopardize the entire training process and result in misclassifications. As system defenders, we have to tackle this issue. Using a label-flipping attack, we investigate the effect of data poisoning attacks on HFL training. We propose a trust management-based strategy to mitigate data poisoning attacks, which assesses client trustworthiness using a Dirichlet distribution. We maintain a record of previous activities, allowing the server to enhance its knowledge based on client reliability. We demonstrate the proposed approach’s effectiveness through improvements in model performance after removing malicious clients, using the MNIST Plus d'infos

Séminaire SLG – 15/02/2024

13 février 2024

Thibault Roux organisera un débat à propos du sujet ci-dessous: « Les progrès récents de la technologie ont soulevé beaucoup de questionnements et d’inquiétudes vis-à-vis de l’impact sur nos sociétés. De nombreuses personnes s’inquiètent de son utilisation militaire, pour la surveillance de masse ou de la désinformation. D’un point de vue plus global, Nick Bostrom, philosophe, théorise l’hypothèse du monde vulnérable qui prédit que la Science détruira l’humanité.Dans ce débat, nous interrogerons nos propres biais en tant que chercheurs et chercheuses, et tenterons de répondre aux questions éthiques que soulève cette hypothèse. Est-ce que la Science est une menace pour l’humanité ? Faut-il arrêter la Science ? Ou plus sérieusement, peut-on trouver une solution pour ne pas s’autodétruire ? »

Journée de conférences – 16/02/2024

13 février 2024

À l’occasion de la journée internationale des femmes en sciences, qui a lieu cette année le dimanche 11 février, le comité égalité-diversité du LIA organise une journée de conférences le vendredi 16 février 2024. Ces conférences seront menées par Cécile Favre, de l’université Lyon 2. Conférence 1: (de 10h à 11h30) Lieu : Amphi Ada Lovelace Titre : La « science des données » au prisme des études de genre : objet de recherche et source de questionnements méthodologiques pour la scientométrie. Le cas du défi EGC 2020. Résumé : Cette communication s’appuie sur le défi lancé par l’association EGC (Extraction et Gestion des Connaissances) qui rassemble des chercheuses et des chercheurs travaillant au croisement de l’informatique et des statistiques, en « science des données ». Pour la 20ème édition de sa conférence annuelle, l’association a mis à disposition des matériaux la concernant en vue de leur analyse. Les matériaux empiriques proposés sont notamment les actes publiés, l’ensemble des emails envoyés sur sa liste de diffusion. Nous avons complété ces matériaux avec des éléments récoltés sur le site Web concernant l’organisation des 19 éditions de la conférence tels que les conférences invitées, les comités de lecture, les comités d’organisation, etc. Plus d'infos

Séminaire Cornet – 31/01/2024

26 janvier 2024

Le prochain séminaire de l’équipe Cornet aura lieu le 31 janvier 2024 à 11h35 en S3, et comportera deux parties. Pour commencer, Felipe Albuquerque (LIA) présentera son sujet de thèse portant sur Le problème de la p-médiane avec contraintes de couverture : nouvelles méthodes de résolution et application à la conception de services publics. Puis, Luca Dini and Pierre Jourlin présenteront leur travail en cours sur le thème des Hybrid Methods for Cognitive Attitudes Detection. Résumé : dans ce séminaire, nous présenterons un travail en cours sur la transformation d’un système de repérage de mots-clés en un moteur d’étiquetage basé sur des concepts. Nous mettrons en évidence quatre axes majeurs de ce travail, à savoir :

Séminaire SLG – Ryan Whetten – 01/02/2024

25 janvier 2024

La prochaine réunion SLG aura lieu en salle S5 le jeudi 1er février, de 12h00 à 13h00. Ryan Whetten y présentera ses travaux, dont vous trouverez une brève introduction ci-dessous. ——————————————————————— Open Implementation and Study of BEST-RQ for Speech Processing Abstract: Self-Supervised Learning (SSL) has proven to be useful in various speech tasks. However, these methods are generally very demanding in terms of data, memory, and computational resources. Recently, Google came out with a model called BEST-RQ (BERT-based Speech pre-Training with Random-projection Quantizer). Despite BEST-RQ’s great performance and simplicity, details are lacking in the original paper and there is no official easy-to-use open-source implementation. Furthermore, BEST-RQ has not been evaluated on other downstream tasks aside from ASR. In this presentation, we will discuss the details of my implementation of BEST-RQ and then see results from our preliminary study on four downstream tasks. Results show that a random projection quantizer can achieve similar downstream performance as wav2vec 2.0 while decreasing training time by over a factor of two.

1 2 3 9