001074837
100  $a                         y50      
101  $afre
2001 $aLa gestion des données dans les Clouds$bressource électronique
210  $aEcole Nationale Supérieure d'informatique : Département de Post-Graduation$cEcole Nationale Supérieure d'informatique
328 1$bDoctorat$cInformatique$eDépartement de Post-Graduation , Ecole Nationale Supérieure d'informatique
330  $aL'émergence de la technologie du Cloud Computing pose de nombreux défis pour la communauté scientifique qui s’intéresse à cette technologie. Un des défis majeurs de cette technologie concerne la gestion des données. Celle-ci se caractérise par deux éléments : (i) la taille des données traitées par les applications Cloud augmente exponentiellement, qui sont des applications à données intensives ; (ii) le deuxième élément concerne le stockage de ces données qui est à la fois volatile (les données se déplacent dans un Cloud) et qui utilise un espace de stockage très large.   Les applications « data-intensive » sont très largement utilisées dans des domaines très divers : extraire de connaissances à partir de données, simulations de modèles réels, simulations atmosphériques, etc. Ces applications posent des défis complexes tant en termes de stockage que de calcul.  Les caractéristiques de ces applications « data-intensive font que les problèmes classiques de gestion de données distribuées deviennent très complexes. Parmi ces problèmes, nous pouvons mentionner le stockage des données, leur localisation, l’accès concurrent et intensif à ces données, la sécurité, etc. Les solutions à ces problèmes doivent répondre à certaines exigences, telles que le passage à l'échelle, la disponibilité, la fiabilité et la sécurité des données.Cette thèse a pour objectif de proposer un système de fichiers distribué (à l’instar du système « BlobSeer File System » ou BSFS). Ce système devrait pouvoir être intégré dans le modèle MapReduce pour développer des applications « data-intensive ».  Ce modèle, qui a été introduit par Google,  a révolutionné la communauté qui s’intéresse aux applications « data-intensive » et s'est rapidement étendu à divers domaines de recherche et de production. Une implémentation domaine publique de l'abstraction mise en avant par Google a été fournie par Yahoo à travers le projet Hadoop. Le framework Hadoop est considéré comme étant l'implémentation deréférence de MapReduce et est actuellement largement utilisé à des fins diverses et sur plusieurs infrastructures. 
610  $aLes applications « data-intensive ». système de fichiers distribué
700  $aCHALABI , Baya
701  $aArray
801 0$aDZ$bCERIST PNST
901$ac