Portail national de signalement des thèses
Recherche en cours
EtablissementUniversité de Tébessa - Larbi Tébessi
AffiliationDépartement d'Informatique
AuteurLEDMI, Abdeldjalil
Directeur de thèseBendjenna Hakim (Maitre de conférence)
Co-directeurSofiane Haméme (Maitre de conférence)
FilièreInformatique
DiplômeDoctorat LMD
TitreContribution pour la tolérance aux fautes dans les systèmes distribués
Mots clésTolérance aux fautes, système distribué, auto-adaptation
RésuméLes progrès remarquables des équipements informatiques et de télécommunications durant ces dernières années ont permis une forte évolution des environnements répartis et parallèles qui les utilisent. On est ainsi passé de réseaux locaux de stations de travail à des réseaux à grande échelle de machines. Cette avancée des équipements a permis l’apparition de nouvelles architectures parallèles de grande taille comme les grappes, les grilles, les systèmes pair à pair, l’informatique dans le nuage et les réseaux sociaux. Ces systèmes deviennent de plus en plus complexes. Ils mettent en jeu un grand nombre d’entités hétérogènes qui doivent coopérer entre elles dans des environnements potentiellement peu fiables et difficiles à contrôler. Toutefois, notre dépendance envers ces systèmes demande à ce qu’ils soient hautement disponibles, malgré la présence de fautes. De multiples études ont montré que les fautes logicielles et les erreurs dans les systèmes d’information sont nombreuses. Certain outils pour améliorer la qualité du code sont conçus pour être résistant face aux inter-blocages; etc. Toutefois, aucun de ces outils ne peut certifier qu’un système sera exempt d’erreurs. Pire encore, certaines erreurs ne sont pas dues à la qualité du code mais proviennent de l’environnement physique. Par conséquent devoir tolérer les fautes logicielles et matérielles est aujourd’hui nécessaire. La tolérance aux pannes ou aux fautes qui essaye de fonctionner en dépit des fautes. Le degré de tolérance aux pannes se mesure par la capacité du système à continuer à délivrer son service en présence de fautes. La tolérance aux pannes dans ces systèmes est un domaine qui à été largement étudié. Il n’existe pas de méthode de tolérance aux pannes qui soit valable dans l’absolu, mais il existe un grand nombre de protocoles de tolérance aux pannes adaptées à des hypothèses particulières. L'objectif de ce travail de thèse, est d'étudier l'impact des méthodes de tolérances aux fautes pour les performances et/ou la disponibilité des systèmes à large échelle. Un premier problème devant être abordé, concerne la proposition d’un mécanisme autonome de détection des défaillances dans un contexte incertain et à large échelle. Le deuxième problème consiste à la mise en œuvre d’actions afin de réparer automatiquement la défaillance détectée.
StatutValidé
format unimarc