Journée de conférences – 16/02/2024

13 février 2024

À l’occasion de la journée internationale des femmes en sciences, qui a lieu cette année le dimanche 11 février, le comité égalité-diversité du LIA organise une journée de conférences le vendredi 16 février 2024. Ces conférences seront menées par Cécile Favre, de l’université Lyon 2. Conférence 1: (de 10h à 11h30) Lieu : Amphi Ada Lovelace Titre : La « science des données » au prisme des études de genre : objet de recherche et source de questionnements méthodologiques pour la scientométrie. Le cas du défi EGC 2020. Résumé : Cette communication s’appuie sur le défi lancé par l’association EGC (Extraction et Gestion des Connaissances) qui rassemble des chercheuses et des chercheurs travaillant au croisement de l’informatique et des statistiques, en « science des données ». Pour la 20ème édition de sa conférence annuelle, l’association a mis à disposition des matériaux la concernant en vue de leur analyse. Les matériaux empiriques proposés sont notamment les actes publiés, l’ensemble des emails envoyés sur sa liste de diffusion. Nous avons complété ces matériaux avec des éléments récoltés sur le site Web concernant l’organisation des 19 éditions de la conférence tels que les conférences invitées, les comités de lecture, les comités d’organisation, etc. Plus d'infos

Séminaire SLG – Ryan Whetten – 01/02/2024

25 janvier 2024

La prochaine réunion SLG aura lieu en salle S5 le jeudi 1er février, de 12h00 à 13h00. Ryan Whetten y présentera ses travaux, dont vous trouverez une brève introduction ci-dessous. ——————————————————————— Open Implementation and Study of BEST-RQ for Speech Processing Abstract: Self-Supervised Learning (SSL) has proven to be useful in various speech tasks. However, these methods are generally very demanding in terms of data, memory, and computational resources. Recently, Google came out with a model called BEST-RQ (BERT-based Speech pre-Training with Random-projection Quantizer). Despite BEST-RQ’s great performance and simplicity, details are lacking in the original paper and there is no official easy-to-use open-source implementation. Furthermore, BEST-RQ has not been evaluated on other downstream tasks aside from ASR. In this presentation, we will discuss the details of my implementation of BEST-RQ and then see results from our preliminary study on four downstream tasks. Results show that a random projection quantizer can achieve similar downstream performance as wav2vec 2.0 while decreasing training time by over a factor of two.

Séminaire SLG – Paul Gauthier Noé – 18/01/2024

10 janvier 2024

On 18 January from 12 am, we will host a talk from Dr. Paul Gauthier Noé on « Explaining probabilistic predictions … ». The presentation will be hosted on room S6.   More details will follow…   Bio: Paul Gauthier Noe just received a PhD in Computer Science in Avignon Université under the supervision of Prof. Jean-François Bonastre and Dr. Driss Matrouf. He was working for the international JST-ANR VoicePersonae project and his main research interests are Speaker verification, Bayesian decision theory, Calibration of probabilities and Privacy in Speech.

Séminaire SLG – Fenna Poletiek – 12/01/2024

8 janvier 2024

On 12 January from 12 am, we will host a virtual talk from Dr. Fenna Poletiek from Institute of Psychology at Leiden University on « Language learning in the lab ».   The presentation will be hosted on room S6.   Abstract: Language learning in the lab Language learning skills have been considered a defining feature of humanness. In this view language cannot be acquired by mere associative or statistical learning processes, only, like many other skills are learned by human and nonhuman primates during development. Indeed, the high (recursive) complexity of human grammars have been shown to make them impossible to learn by exposure to language exemplars only. Some research suggests, however, that at least some statistical learning is recruited in language acquisition (Perruchet & Pacton, 2006). And primates have been shown to mimic complex grammatical patterns after being trained on a sequence of stimulus responses (Rey et al., 2012). We performed series of studies with artificial languages in the lab, to investigate associative and statistical learning processes that support language learning. The results thus far suggest a fine tuned cooperation between three crucial features of the natural language learning process: first, learning proceeds ‘starting small’ with short simple sentences growing in complexity Plus d'infos

NACHOS – Corpus Biomédical français

19 décembre 2023

NACHOS est un corpus biomédical français. Il est uniquement disponible pour la recherche académique. Si vous êtes intéressé, contactez Mickael Rouvier. Veuillez inclure votre nom, prénom, affiliation, coordonnées et une brève description de la manière dont vous comptez utiliser NACHOS. Site : https://drbert.univ-avignon.fr/

Soutenance de thèse de Julio Perez-Garcia – 18 décembre 2023

14 décembre 2023

Lieu :  University of Avignon, Campus Hannah Arendt, Salle des Thèses Date : Monday, December 18, 2023 at 14:00. Titre : Contribution to security and privacy in the Blockchain-based Internet of Things: Robustness, Reliability, and Scalability. Résumé : The Internet of Things (IoT) is a diverse network of objects or ”things” typically interconnected via the Internet. Given the sensitivity of the information exchanged in IoT applications, it is essential to guarantee security and privacy. This problem is aggravated by the open nature of wireless communications, and the power and computing resource limitations of most IoT devices. At the same time, existing IoT security solutions are based on centralized architectures, which raises scalability issues and the single point of failure problem, making them susceptible to denial-of-service attacks and technical failures. Blockchain has emerged as an attractive solution to IoT security and centralization issues. Blockchains replicate a permanent, append-only record of all transactions occurring on a network across multiple devices, keeping them synchronized through a consensus protocol. Blockchain implementation may involve high computational and energy costs for devices. Consequently, solutions based on Fog/Edge computing have been considered in the integration with IoT. This approach shifts the higher computational load and higher energy consumption Plus d'infos

Projet DAPADAF-E

13 décembre 2023

Validity of a task of acoustic-phonetic decoding on anatomic deficits in paramedical assessment of speech disorders for patients treated for oral or oropharyngeal cancer Plus d'infos

Seminaire SLG – St Germes Bengono Obiang – 21/12/2023

12 décembre 2023

Le prochain SLG meeting se tiendra en salle S1 le jeudi 21 décembre, de 12h00 à 13h00.   Nous aurons le plaisir d’accueillir St Germes BENGONO OBIANG, doctorant travaillant sur le traitement de la parole, plus particulièrement sur la reconnaissance des tons dans les langues peu dotées. Il est encadré par Norbert TSOPZE et Paulin MELATAGIA de l’Université de Yaoundé 1, ainsi que par Jean-François BONASTRE et Tania JIMENEZ du LIA.   Résumé : Many sub-Saharan African languages are categorized as tone languages and for the most part, they are classified as low resource languages due to the limited resources and tools available to process these languages. Identifying the tone associated with a syllable is therefore a key challenge for speech recognition in these languages. We propose models that automate the recognition of tones in continuous speech that can easily be incorporated into a speech recognition pipeline for these languages. We have investigated different neural architectures as well as several features extraction algorithms in speech (Filter banks, Leaf, Cestrogram, MFCC). In the context of low-resource languages, we also evaluated Wav2vec models for this task. In this work, we use a public speech recognition dataset on Yoruba. As for the results, Plus d'infos

Projet ANR EVA

1 janvier 2023

La description d’une voix en quelques mots reste une tâche très arbitraire. On peut parler avec une voix ‘profonde’, ‘soufflée’, ‘claire’ ou ‘rauque’, mais la caractérisation complète d’une voix nécessiterait un ensemble précis d’attributs rigoureusement définis constituant une ontologie. Cependant, une telle grille de description n’existe pas. L’apprentissage automatique appliqué à la parole souffre de la même faiblesse : dans la plupart des tâches de traitement automatique, lorsqu’un locuteur est modélisé, des représentations globales abstraites sont utilisées sans rendre leurs caractéristiques explicites. Plus d'infos

Projet ANR UMICROWD

1 septembre 2022

UMICrowd a pour objectif de comprendre les dynamiques du crowdfunding, d’explorer sa dimension sociale et de modéliser les interactions entre ses différents acteurs. Cette compréhension et cette modélisation permettront de développer un cadre d’aide à la décision pour les plateformes dans le processus de classification, sélection et promotion des projets, avec pour objectif d’augmenter son impact socio-environnemental. Plus d'infos

1 2 3 4 5