| Etablissement | Ecole Nationale Supérieure d'informatique | | Affiliation | Département de Post-Graduation | | Auteur | MADANI, Amina | | Directeur de thèse | Omar Boussaid (Professeur) | | Co-directeur | Zegour Djamel Eddine (Professeur) | | Filière | Informatique | | Diplôme | Doctorat | | Titre | Fouille dans les documents semi-structurés | | Mots clés | documents semi-structurés, fouille de données, text mining, classification, clustering | | Résumé | Les documents semi-structurés et plus particulièrement XML sont devenus de plus en plus répandus. Ces derniers utilisent un langage permettant généralement de décrire les données et faciliter ainsi leurs transferts. D’autres langages, tels que RDF (et RDF/S), OWL, ..., sont utilisés pour décrire des informations sémantiques, des ontologies…
Cet intérêt porté sur les documents XML peut être étendu à d’autres documents,notamment les documents RDF ou OWL. Cependant, les problèmes à aborder seront différents. Les documents RDF par exemple décrivent des informations sémantiques. Le recours aux techniques de la recherche d’informations peut s’avérer intéressant à explorer. De même, les documents OWL qui représentent des ontologies posent d’autres problèmes.
L’objectif de ce travail de recherche est, dans un premier temps, d’identifier les verrous scientifiques liés aux différents types de documents semi-structurés et de classifier les problèmes respectifs. Il s’agit ensuite de construire des solutions en combinant différentes approches pour définir des nouvelles techniques efficaces de fouille dans les documents semi-structurés. | | Statut | Vérifié |
|