INDEXATION DE BASE DE DONNEES AUDIO à l’aide de cartes auto-organisatrices (SOM) basée sur une ontologie
No Thumbnail Available
Date
2009
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
CHERGUI WAHID
Abstract
Pour regrouper les documents audio de sorte que les appels similaires appartiennent au
même groupe. Une méthode qui peut résoudre le problème d’indexation audio doit
comprendre les quatre éléments suivants: la méthode de transcription, la méthode de
représentation des documents, l'algorithme de regroupement et la méthode de représentation
des résultats.
A travers la méthode de transcription, les documents audio sont transcris par le
système ASR (Automatic Speech Recognition) sous forme de documents texte dans
différentes langues, et pour les indexer thématiquement il faut qu’on résolve le problème de
multilinguisme, pour cela la méthode de présentation doit présenter les documents
transcrits sous forme de vecteur de concepts obtenus par la projection sur l’ontologie de
domaine. C’est la raison pour laquelle la méthode basée sur une ontologie a été choisie, où
les instances des termes sont de type multi langue. La méthode de regroupement doit être
suffisamment puissante pour pouvoir grouper un grand ensemble de documents et permettre à
l’utilisateur de visualiser des résultats. Les cartes auto organisatrices « SOM » ont été choisies
pour cette raison.