La gestion des données dans les Clouds

CHALABI, Baya

Recherche en cours

Etablissement	Ecole Nationale Supérieure d'informatique
Affiliation	Département de Post-Graduation
Auteur	CHALABI, Baya
Directeur de thèse	Yahya SLIMANI (Professeur)
Filière	Informatique
Diplôme	Doctorat
Titre	La gestion des données dans les Clouds
Mots clés	Les applications « data-intensive ». système de fichiers distribué
Résumé	L'émergence de la technologie du Cloud Computing pose de nombreux défis pour la communauté scientifique qui s’intéresse à cette technologie. Un des défis majeurs de cette technologie concerne la gestion des données. Celle-ci se caractérise par deux éléments : (i) la taille des données traitées par les applications Cloud augmente exponentiellement, qui sont des applications à données intensives ; (ii) le deuxième élément concerne le stockage de ces données qui est à la fois volatile (les données se déplacent dans un Cloud) et qui utilise un espace de stockage très large. Les applications « data-intensive » sont très largement utilisées dans des domaines très divers : extraire de connaissances à partir de données, simulations de modèles réels, simulations atmosphériques, etc. Ces applications posent des défis complexes tant en termes de stockage que de calcul. Les caractéristiques de ces applications « data-intensive font que les problèmes classiques de gestion de données distribuées deviennent très complexes. Parmi ces problèmes, nous pouvons mentionner le stockage des données, leur localisation, l’accès concurrent et intensif à ces données, la sécurité, etc. Les solutions à ces problèmes doivent répondre à certaines exigences, telles que le passage à l'échelle, la disponibilité, la fiabilité et la sécurité des données.Cette thèse a pour objectif de proposer un système de fichiers distribué (à l’instar du système « BlobSeer File System » ou BSFS). Ce système devrait pouvoir être intégré dans le modèle MapReduce pour développer des applications « data-intensive ». Ce modèle, qui a été introduit par Google, a révolutionné la communauté qui s’intéresse aux applications « data-intensive » et s'est rapidement étendu à divers domaines de recherche et de production. Une implémentation domaine publique de l'abstraction mise en avant par Google a été fournie par Yahoo à travers le projet Hadoop. Le framework Hadoop est considéré comme étant l'implémentation deréférence de MapReduce et est actuellement largement utilisé à des fins diverses et sur plusieurs infrastructures.
Statut	Vérifié

format unimarc