Etablissement | Ecole Nationale Supérieure d'informatique | Affiliation | Département de Post-Graduation | Auteur | YDROUDJ, ASSIA | Directeur de thèse | Ladjel BELLATRECHE (Professeur) | Co-directeur | Selma KHOURI | Filière | Informatique | Diplôme | Magister | Titre | déploiement et Interrogation des bases de données sémantiques sur le cloud computing | Mots clés | cloud computing, données sémantiques, bases de données à base ontologique, langage d | Résumé | Actuellement, de nouvelles applications autour des réseaux sociaux, opinion mining, Web
sémantique, etc. se sont développées de manière spectaculaire. Ses applications sont
consommatrices de données (big data). La gestion de cette masse de données devient un enjeu
économique important. Deux types de solutions émergent pour répondre à ce défi : des solutions
orientées persistance de données (ex. bases de données) et des solutions orientées puissance de
calcul comme les nuages informatiques (cloud computing), machine parallèles, etc. Le cloud
computing offre des solutions en termes de puissance de calcul et de stockage ainsi qu’une
possibilité d’interrogation intuitive aux utilisateurs. Plusieurs acteurs industriels comme Google,
Microsoft, Amazon, Yahoo! ou encore Facebook proposent des plateformes de cloud. En parallèle de
ce développement matériel autour des infrastructures, un autre développement concernait la nature
des sources de données alimentant les applications « big data ». Ces sont des sources de données
sémantiques qui stockent les instances et l’ontologie décrivant leur sens. Plusieurs systèmes de
gestion de base de données (SGBD) comme Oracle et IBM proposent des solutions gérant ce type de
base de données. Ces systèmes diffèrent de (1) leurs architectures (nous distinguons trois types
d’architectures : Type 1, Type 2 et Type 3 [9]), (2) les modèles de stockage dédiés aux instances et
aux ontologies (représentation verticale, représentation horizontale et représentation hybride) et (3)
les langages de requêtes les manipulant (SQL, SparQL, etc.). Rappelons qu’une ontologie est une
spécification explicite d’une conceptualisation. Au LIAS, nous distinguons trois types d’ontologies : les
ontologies conceptuelles canoniques qui fournissent une base formelle pour modéliser et échanger
efficacement la connaissance d’un domaine donné. Les ontologies conceptuelles non canoniques
fournissant des mécanismes pour lier différentes conceptualisations faites sur ce domaine.
Finalement, les ontologies linguistiques fournissant une représentation en langage naturel des
concepts de ce domaine, éventuellement dans différentes langues. Avoir une ontologie est une
chance pour les utilisateurs et les concepteurs, car ils peuvent interroger les sources de données
indépendamment de la solution technique implémentant la source.
Dans le cas où les bases de données sémantiques sont déployées sur le cloud, une confrontation
des langages sémantiques et des langages de cloud doit être établie. Cette confrontation nous
motive à proposer un langage de requêtes cloud dédié aux données sémantiques permettant
d’intégrer les trois types d’ontologies : (i) les ontologies conceptuelles canoniques, (ii) les ontologies
conceptuelles non canoniques et (3) les ontologiques linguistiques. Dans ce cas, le cloud devient Web
et le langage devient l’interface d’un moteur de recherche (ex. google). | Statut | Vérifié |
|