Université d'Avignon et des Pays de Vaucluse
Projet du Cours Résumé automatique (TP 8) -- Master 2
Avignon le 9 décembre 2011
Ce TP de resumé automatique veut reutiliser les modulès d'un système de resume automatique guidé par les besoins de l'utilisateur déjà programmés.
Il s'agit de programmer la méthode Enertex pour calculer la pondération de phrases.
Enertex génerique
Il s'agit de développer le module Enertex générique (la reqûete ou titre du document ne sera pas pris en compte).
A partir de la matrice S[PxN] de P phrases x N termes, il s'agit de calculer:
E[PxP] = (S x S transposée)²
Puis de trier les P phrases selon leur valeur absolue d'energie | E[i=1...P] |.
Enertex personnalisé
Il s'agit de développer le module Enertex personnalisé (la reqûete ou titre du document est pris en compte).
A partir de la matrice S[PxN] de P phrases x N termes, il s'agit de calculer E[PxP] = (S x S trasposée)²
Puis de trier les P phrases selon leur valeur absolue d'energie | E[i=1...P] | par rapport à la phrase thématique
La phrase thématique pey être le titre du document, a ce moment la il y a P+1 phrases
Les objectifs que l'on veut atteindre se décomposent ainsi :
A) Développer un programme appelé enertex.pl qui permettra :
Lire un ficihier texte, le pretraiter et obtenir un résumé soit generique soit personnalisé (par parametre)
Quelles améliorations pourraient être programmés? N'ayez pas peur ! Soyez créatifs
Rendu du TP: CODES SOURCES + EVALUATIONS LE VENDREDI 16 DECEMBRE 2011 AVANT 24h00
Envoyer
par mail a: juan-manuel.torres@univ-avignon
avec le subject : RA:TP8:Nom
Bon résumé !!!
Enseignant : Juan-Manuel Torres Moreno