Applying RADIC in Open MPI : the methodology used to implement RADIC over a Message Passing Library
Fialho Queiroz, Leonardo
Rexachs del Rosario, Dolores Isabel, dir.
Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Data: 2008
Descripció: 196 p.
Resum: Fault tolerance has become a major issue for computer and software engineers because the occurrence of faults increases the cost of using a parallel computer. RADIC is the fault tolerance architecture for message passing systems which is transparent, decentralized, flexible and scalable. This master thesis presents the methodology used to implement the RADIC architecture over Open MPI, a well-know large-used message passing library. This implementation kept the RADIC architecture characteristics. In order to validate the implementation we have executed a synthetic ping program, besides, to evaluate the implementation performance we have used the NAS Parallel Benchmarks. The results prove that the RADIC architecture performance depends on the communication pattern of the parallel application which is running. Furthermore, our implementation proves that the RADIC architecture could be implemented over an existent message passing library.
Resum: La tolerància a fallades s'ha convertit en un requeriment important pels enginyers informàtics i els desenvolupadors de programari, degut a que l'aparició de fallades augmenta el cost d'explotació d'un ordinador paral·lel. RADIC és una arquitectura de tolerància a fallades per sistemes de pas de missatges transparent, descentralitzada, flexible i escalable. Aquest treball d'investigació de final de màster presenta la metodologia utilitzada per implementar l'arquitectura RADIC per a Open MPI, una llibreria ben coneguda i molt utilitzada de pas de missatges. Aquesta implementació manté les característiques originals de RADIC. Per validar la implementació executem una aplicació sintètica de ping. A més, per avaluar les prestacions de la implementació utilitzem els benchmarks paral·lels NAS. Els resultats han provat que les prestacions de l'arquitectura RADIC depenen de l'aplicació que s'estigui executant. A més, la nostra implementació prova que l'arquitectura RADIC pot ser implentada en una llibreria de pas de missatges ja existent.
Drets: Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el departament i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús Creative Commons
Llengua: Anglès
Titulació: Còmput d'Altes Prestacions, Teoria de la Informació i Seguretat / High Performance Computing, Information Theory and Security [4313133]
Col·lecció: Escola d'Enginyeria. Treballs de màster i postgrau. Màster en Computació d'Altes Prestacions
Document: Treball de fi de postgrau
Matèria: Tolerància als errors (Informàtica) ; Ordinadors paral·lels



196 p, 1.7 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Enginyeria. TFM

 Registre creat el 2009-07-14, darrera modificació el 2022-08-21



   Favorit i Compartir