Portail national de signalement des thèses
Recherche en cours
EtablissementEcole Nationale Supérieure d'informatique
AffiliationDépartement de Post-Graduation
AuteurMADANI, Amina
Directeur de thèseOmar Boussaid (Professeur)
Co-directeurZegour Djamel Eddine (Professeur)
FilièreInformatique
DiplômeDoctorat
TitreFouille dans les documents semi-structurés
Mots clésdocuments semi-structurés, fouille de données, text mining, classification, clustering
RésuméLes documents semi-structurés et plus particulièrement XML sont devenus de plus en plus répandus. Ces derniers utilisent un langage permettant généralement de décrire les données et faciliter ainsi leurs transferts. D’autres langages, tels que RDF (et RDF/S), OWL, ..., sont utilisés pour décrire des informations sémantiques, des ontologies… Cet intérêt porté sur les documents XML peut être étendu à d’autres documents,notamment les documents RDF ou OWL. Cependant, les problèmes à aborder seront différents. Les documents RDF par exemple décrivent des informations sémantiques. Le recours aux techniques de la recherche d’informations peut s’avérer intéressant à explorer. De même, les documents OWL qui représentent des ontologies posent d’autres problèmes. L’objectif de ce travail de recherche est, dans un premier temps, d’identifier les verrous scientifiques liés aux différents types de documents semi-structurés et de classifier les problèmes respectifs. Il s’agit ensuite de construire des solutions en combinant différentes approches pour définir des nouvelles techniques efficaces de fouille dans les documents semi-structurés.
StatutVérifié
format unimarc