Paper
Approche statistique pour le repérage de mots informatifs dans les textes oraux
Nous presentons les resultats de l’approche statistique que nous avons developpee pour le reperage de mots informatifs a partir de textes oraux. Ce travail fait partie d’un projet lance par le departement de la defense canadienne pour le developpement d’un systeme d’extraction d’information dans le domaine de la Recherche et Sauvetage maritime (SAR). Il s’agit de trouver et annoter les mots pertinents avec des etiquettes semantiques qui sont les concepts d’une ontologie du domaine (SAR). Notre methode combine deux types d’information : les vecteurs de similarite generes grâce a l’ontologie du domaine et le dictionnaire-thesaurus Wordsmyth ; le contexte d’enonciation represente par le theme. L’evaluation est effectuee en comparant la sortie du systeme avec les reponses de formulaires d’extraction d’information predefinis. Les resultats obtenus sur les textes oraux sont comparables a ceux obtenus dans le cadre de MUC7 pour des textes ecrits.
Authors: Narjès Boufaden · Yoshua Bengio · Guy Lapalme