Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2011

Statistical approach versus linguistical approach in semantic indexing for multilingual documents

Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues

Résumé

Dans cet article nous présentons une approche statistique d'indexation sémantique des documents multilingues. L'approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d'expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l'approche statistique obtient des résultats équivalents à l'approche linguistique sans adapter la phase d'indexation à la langue du document.
Fichier non déposé

Dates et versions

hal-02595625 , version 1 (15-05-2020)

Identifiants

Citer

L. Maisonnasse, Catherine Roussey, S. Calabretto, F. Harrathi. Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2011, 14 (2), pp.193-214. ⟨hal-02595625⟩
15 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More