| Etablissement | Ecole Nationale Supérieure d'informatique | | Affiliation | Département de Post-Graduation | | Auteur | CHALABI, Baya | | Directeur de thèse | Yahya SLIMANI (Professeur) | | Filière | Informatique | | Diplôme | Doctorat | | Titre | La gestion des données dans les Clouds | | Mots clés | Les applications « data-intensive ».
système de fichiers distribué | | Résumé | L'émergence de la technologie du Cloud Computing pose de nombreux défis pour la communauté scientifique qui s’intéresse à cette technologie. Un des défis majeurs de cette technologie concerne la gestion des données. Celle-ci se caractérise par deux éléments : (i) la taille des données traitées par les applications Cloud augmente exponentiellement, qui sont des applications à données intensives ; (ii) le deuxième élément concerne le stockage de ces données qui est à la fois volatile (les données se déplacent dans un Cloud) et qui utilise un espace de stockage très large.
Les applications « data-intensive » sont très largement utilisées dans des domaines très divers : extraire de connaissances à partir de données, simulations de modèles réels, simulations atmosphériques, etc. Ces applications posent des défis complexes tant en termes de stockage que de calcul.
Les caractéristiques de ces applications « data-intensive font que les problèmes classiques de gestion de données distribuées deviennent très complexes. Parmi ces problèmes, nous pouvons mentionner le stockage des données, leur localisation, l’accès concurrent et intensif à ces données, la sécurité, etc. Les solutions à ces problèmes doivent répondre à certaines exigences, telles que le passage à l'échelle, la disponibilité, la fiabilité et la sécurité des données.Cette thèse a pour objectif de proposer un système de fichiers distribué (à l’instar du système « BlobSeer File System » ou BSFS). Ce système devrait pouvoir être intégré dans le modèle MapReduce pour développer des applications « data-intensive ». Ce modèle, qui a été introduit par Google, a révolutionné la communauté qui s’intéresse aux applications « data-intensive » et s'est rapidement étendu à divers domaines de recherche et de production. Une implémentation domaine publique de l'abstraction mise en avant par Google a été fournie par Yahoo à travers le projet Hadoop. Le framework Hadoop est considéré comme étant l'implémentation deréférence de MapReduce et est actuellement largement utilisé à des fins diverses et sur plusieurs infrastructures.
| | Statut | Vérifié |
|