Alineamiento múltiple de secuencias con T-Coffee : una aproximación paralela
Naranjo Basalo, Yandi
Hernández Budé, Porfidio, dir.
Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Data: 2009
Descripció: 102 p.
Resum: Las aplicaciones de alineamiento múltiple de secuencias son prototipos de aplicaciones que requieren elevada potencia de cómputo y memoria. Se destacan por la relevancia científica que tienen los resultados que brindan a investigaciones científicas en el campo de la biomedicina, genética y farmacología. Las aplicaciones de alineamiento múltiple tienen la limitante de que no son capaces de procesar miles de secuencias, por lo que se hace necesario crear un modelo para resolver la problemática. Analizando el volumen de datos que se manipulan en el área de las ciencias biológica y la complejidad de los algoritmos de alineamiento de secuencias, la única vía de solución del problema es a través de la utilización de entornos de cómputo paralelos y la computación de altas prestaciones. La investigación realizada por nosotros tiene como objetivo la creación de un modelo paralelo que le permita a los algoritmos de alineamiento múltiple aumentar el número de secuencias a procesar, tratando de mantener la calidad en los resultados para garantizar la precisión científica. El modelo que proponemos emplea como base la clusterización de las secuencias de entrada utilizando criterios biológicos que permiten mantener la calidad de los resultados. Además, el modelo se enfoca en la disminución del tiempo de cómputo y consumo de memoria. Para presentar y validar el modelo utilizamos T-Coffee, como plataforma de desarrollo e investigación. El modelo propuesto pudiera ser aplicado a cualquier otro algoritmo de alineamiento múltiple de secuencias.
Resum: The multiple sequence alignment applications are of those requiring high computing potency and memory. This kind of applications has a hugh scientific importance due to their contribution to investigations in biomedicine, genetics and pharmacology for example. However, these applications are limited in the number of sequences they can analyze at once, being incapable to process thousand of sequences and justifying the need for a model to solve this problem. If we analyze the amount of data that is manipulated in biological investigations, and the complexity of the algorithms for sequence alignment, we realize that the only way to solve the problem is through the use of parallel and high performance computing. The research presented in this work, is about a parallel model allowing the increase of input sequences to the multiple alignment algorithms trying to maintain the quality in the final results to guarantee the scientific precision. The model proposed uses the clustering of input sequences as a base, employing biological information to maintain the quality of the results, and also diminishing the computing time and memory consumption. We used the T-Coffee algorithm as a development and research platform to present and validate the proposed model. We intend that our proposed model could be applied to any other algorithm for multiple sequence alignment.
Drets: Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el departament i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús Creative Commons
Llengua: Castellà
Titulació: Còmput d'Altes Prestacions, Teoria de la Informació i Seguretat / High Performance Computing, Information Theory and Security [4313133]
Col·lecció: Escola d'Enginyeria. Treballs de màster i postgrau. Màster en Computació d'Altes Prestacions
Document: Treball de fi de postgrau
Matèria: Processament electrònic de dades ; Disseny de sistemes



102 p, 3.6 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Enginyeria. TFM

 Registre creat el 2009-11-02, darrera modificació el 2022-08-18



   Favorit i Compartir