Intitulé du stage Extraction d’informations dans fr.wikipedia Nom de la personne proposant le stage Pierre Jourlin Lieu du stage L.I.A Descriptif du stage : Le stage se situe dans le cadre d’un projet nommé ‘Les élus français dans Wikipédia’ qui sera soumis pour financement à la SFR Agorantic en octobre prochain par Pierre Jourlin (LIA) et Guillaume Marrel (LBNC).Dans le cadre d’une étude sociologique sur les « dictionnaires biographiques » des élu.e.s politiques français.e.s, nous disposons d’une version informatisée du Registre National des Élus (RNE) comme base nominative de référence : la totalité des candidats élus ou nommés sur le territoire national dans toutes les assemblées municipales, intercommunales, départementales, régionales, nationales et européenne, y sont recensés et caractérisés succinctement (nom, prénom, date de naissance, profession déclarée, nuance politique), soit environ 900000 personnes répartis sur plus de 500000 mandats, de 2001 à nos jours. Il s’agit de croiser cette base nominative avec Wikipédia pour extraire, lorsqu’elles sont disponibles, toutes les informations biographiques concernant ces élus. Dans certains cas, ces informations sont déjà structurées sous la forme d’infoboites. Certaines sont même déjà extraites sous forme de triplets RDF (Resource Description Framework, voir Web Sémantique et dbpedia) , donc facilement exploitables sous forme relationnelle. Le Plus d'infos