Prédiction de l’influence hors ligne à partir de l’activité en ligne

Ces scripts sont destinés à extraire certaines caractéristiques à partir de données brutes de Twitter décrivant les utilisateurs (tweets, informations de profil ainsi que des données externes). Une fois les caractéristiques extraites, différentes formes de SVM (machines à vecteurs de support) sont entraînées et des régressions logistiques sont effectuées pour classifier ces utilisateurs. Ces opérations sont menées sur différents sous-groupes de caractéristiques. Les détails du processus sont donnés dans les publications ci-dessous. Les scripts ont été appliqués à la classification des utilisateurs de Twitter en termes d’influence hors ligne, sur la base du jeu de données RepLab 2014.

  • URL : https://github.com/CompNet/Influence
  • Date de production : 2014–2015
  • Publications liées :
    • Jean-Valère Cossu, Vincent Labatut et Nicolas Dugué. « A Review of Features
      for the Discrimination of Twitter Users : Application to the Prediction of Offline
      Influence ». In : Social Network Analysis and Mining (SNAM) 6:25 (2016). DOI:
      10.1007/s13278-016-0329-x. ⟨hal-01203171
    • Jean-Valère Cossu, Nicolas Dugué et Vincent Labatut. « Detecting Real-World
      Influence Through Twitter ». In : 2nd European Network Intelligence Conference (ENIC).
      Karlskrona, SE : IEEE Publishing, 2015, p. 83-90. DOI: 10.1109/ENIC.2015.20.
      hal-01164453(publication à citer si vous utilisez ce code source)