Portail national de signalement des thèses
Recherche en cours
EtablissementEcole Nationale Supérieure d'informatique
AffiliationDépartement de Post-Graduation
AuteurYDROUDJ, ASSIA
Directeur de thèseLadjel BELLATRECHE (Professeur)
Co-directeurSelma KHOURI
FilièreInformatique
DiplômeMagister
Titredéploiement et Interrogation des bases de données sémantiques sur le cloud computing
Mots cléscloud computing, données sémantiques, bases de données à base ontologique, langage d
RésuméActuellement, de nouvelles applications autour des réseaux sociaux, opinion mining, Web sémantique, etc. se sont développées de manière spectaculaire. Ses applications sont consommatrices de données (big data). La gestion de cette masse de données devient un enjeu économique important. Deux types de solutions émergent pour répondre à ce défi : des solutions orientées persistance de données (ex. bases de données) et des solutions orientées puissance de calcul comme les nuages informatiques (cloud computing), machine parallèles, etc. Le cloud computing offre des solutions en termes de puissance de calcul et de stockage ainsi qu’une possibilité d’interrogation intuitive aux utilisateurs. Plusieurs acteurs industriels comme Google, Microsoft, Amazon, Yahoo! ou encore Facebook proposent des plateformes de cloud. En parallèle de ce développement matériel autour des infrastructures, un autre développement concernait la nature des sources de données alimentant les applications « big data ». Ces sont des sources de données sémantiques qui stockent les instances et l’ontologie décrivant leur sens. Plusieurs systèmes de gestion de base de données (SGBD) comme Oracle et IBM proposent des solutions gérant ce type de base de données. Ces systèmes diffèrent de (1) leurs architectures (nous distinguons trois types d’architectures : Type 1, Type 2 et Type 3 [9]), (2) les modèles de stockage dédiés aux instances et aux ontologies (représentation verticale, représentation horizontale et représentation hybride) et (3) les langages de requêtes les manipulant (SQL, SparQL, etc.). Rappelons qu’une ontologie est une spécification explicite d’une conceptualisation. Au LIAS, nous distinguons trois types d’ontologies : les ontologies conceptuelles canoniques qui fournissent une base formelle pour modéliser et échanger efficacement la connaissance d’un domaine donné. Les ontologies conceptuelles non canoniques fournissant des mécanismes pour lier différentes conceptualisations faites sur ce domaine. Finalement, les ontologies linguistiques fournissant une représentation en langage naturel des concepts de ce domaine, éventuellement dans différentes langues. Avoir une ontologie est une chance pour les utilisateurs et les concepteurs, car ils peuvent interroger les sources de données indépendamment de la solution technique implémentant la source. Dans le cas où les bases de données sémantiques sont déployées sur le cloud, une confrontation des langages sémantiques et des langages de cloud doit être établie. Cette confrontation nous motive à proposer un langage de requêtes cloud dédié aux données sémantiques permettant d’intégrer les trois types d’ontologies : (i) les ontologies conceptuelles canoniques, (ii) les ontologies conceptuelles non canoniques et (3) les ontologiques linguistiques. Dans ce cas, le cloud devient Web et le langage devient l’interface d’un moteur de recherche (ex. google).
StatutVérifié
format unimarc