Ces scripts sont destinés à extraire certaines caractéristiques à partir de données brutes de Twitter décrivant les utilisateurs (tweets, informations de profil ainsi que des données externes). Une fois les caractéristiques extraites, différentes formes de SVM (machines à vecteurs de support) sont entraînées et des régressions logistiques sont effectuées pour classifier ces utilisateurs. Ces opérations sont menées sur différents sous-groupes de caractéristiques. Les détails du processus sont donnés dans les publications ci-dessous. Les scripts ont été appliqués à la classification des utilisateurs de Twitter en termes d’influence hors ligne, sur la base du jeu de données RepLab 2014.