Université d'Avignon et des Pays de Vaucluse

Projet du Cours Résumé automatique (TP 8) -- Master 2

Avignon le 9 décembre 2011

Ce TP de resumé automatique veut reutiliser les modulès d'un système de resume automatique guidé par les besoins de l'utilisateur déjà programmés. 

Il s'agit de programmer la méthode Enertex pour calculer la pondération de phrases.

Enertex génerique

 Il s'agit de développer le module Enertex générique (la reqûete ou titre du document ne sera pas pris en compte).

A partir de la matrice S[PxN] de P phrases x N termes, il s'agit de calculer:

E[PxP] = (S x S transposée)²

Puis de trier les P phrases selon leur valeur absolue d'energie | E[i=1...P] |.

Enertex personnalisé

 Il s'agit de développer le module Enertex personnalisé (la reqûete ou titre du document est pris en compte).

A partir de la matrice S[PxN] de P phrases x N termes, il s'agit de calculer E[PxP] = (S x S trasposée)²

Puis de trier les P phrases selon leur valeur absolue d'energie | E[i=1...P] | par rapport à la phrase thématique

La phrase thématique pey être le titre du document, a ce moment la il y a P+1 phrases

Les objectifs que l'on veut atteindre se décomposent ainsi :

A) Développer un programme appelé enertex.pl qui permettra :

  1. Lire un ficihier texte, le pretraiter et obtenir un résumé soit generique soit personnalisé (par parametre)

  2. Quelles améliorations pourraient être programmés? N'ayez pas peur ! Soyez créatifs 

Utiliser la bibliothèque

use Math::Matrix;

Avec les fonctions:

 $mat   = new Math::Matrix(@s_matrix);    # S

 $mat  = $mat->transpose;            # ST

 $mat = $mat->multiply($mat);            # SxST

Essayer de paralleliser ou accélerer le processus.

    Rendu du TP: CODES SOURCES + EVALUATIONS LE VENDREDI 16 DECEMBRE 2011 AVANT 24h00

Envoyer par mail a: juan-manuel.torres@univ-avignon avec le subject : RA:TP8:Nom


Bon résumé !!! 

Enseignant : Juan-Manuel Torres Moreno