Evaluating ML-based continuous predictors for missense variant pathogenicity

dc.contributor.author
Díaz Vásquez, Aitana
dc.date.issued
2026-01-20T13:22:57Z
dc.date.issued
2026-01-20T13:22:57Z
dc.date.issued
2025-06-18
dc.identifier
https://hdl.handle.net/10230/72288
dc.description.abstract
Treball de fi de grau en Bioinformàtica. Curs 2024-2025
dc.description.abstract
Tutor: Xavier de la Cruz Montserrat
dc.description.abstract
Aquest projecte avalua predictors continus basats en l'aprenentatge automàtic per estimar la patogenicitat de variants amb canvi de sentit, un repte clau en el diagnòstic de malalties genètiques. Es van analitzar unes 46.000 variants procedents de ClinVar i Humsavar amb cinc predictors quantitatius (CADD, MetaRNN, Envision, QAFI, EVE) i quatre classificadors binaris (AlphaMissense, BayesDel, REVEL, VEST4). Les prediccions es van obtenir amb VEP gràcies a diverses pipelines, i s’avaluaren mitjançant mètriques com AUROC, sensibilitat, especificitat i calibratge. Els resultats ofereixen criteris objectius per a l’ús clínic i el desenvolupament futur d’aquestes eines.
dc.description.abstract
Este proyecto evalúa predictores continuos basados en aprendizaje automático para estimar la patogenicidad de variantes con cambio de sentido, un reto clave en el diagnóstico de enfermedades genéticas. Se analizaron unas 46.000 variantes procedentes de ClinVar y Humsavar utilizando cinco predictores cuantitativos (CADD, MetaRNN, Envision, QAFI, EVE) y cuatro clasificadores binarios (AlphaMissense, BayesDel, REVEL, VEST4). Las predicciones se obtuvieron con VEP mediante diversos pipelines, y se evaluaron utilizando métricas como AUROC, sensibilidad, especificidad y calibración. Los resultados ofrecen criterios objetivos para el uso clínico y el desarrollo futuro de estas herramientas.
dc.description.abstract
This project evaluates continuous predictors based on machine learning to estimate the pathogenicity of missense variants, a key challenge in the diagnosis of genetic diseases. Approximately 46,000 variants from ClinVar and Humsavar were analyzed using five quantitative predictors (CADD, MetaRNN, Envision, QAFI, EVE) and four binary classifiers (AlphaMissense, BayesDel, REVEL, VEST4). Predictions were obtained using VEP through various pipelines, and performance was assessed using metrics such as AUROC, sensitivity, specificity, and calibration. The results provide objective criteria for the clinical use and future development of these tools.
dc.format
application/pdf
dc.language
eng
dc.rights
This is an Open Access article distributed under the terms of the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 license
dc.rights
Attribution-NonCommercial-NoDerivatives 4.0 International
dc.rights
https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights
info:eu-repo/semantics/openAccess
dc.subject
Treball de fi de grau – Curs 2024-2025
dc.subject
Predictors de patogenicitat
dc.subject
Variants amb canvi de sentit
dc.subject
Calibratge
dc.subject
Predictores de patogenicidad
dc.subject
Variantes con cambio de sentido
dc.subject
Calibración
dc.subject
Athogenicity predictors
dc.subject
Missense variants
dc.subject
Calibration
dc.title
Evaluating ML-based continuous predictors for missense variant pathogenicity
dc.type
info:eu-repo/semantics/bachelorThesis


Ficheros en el ítem

FicherosTamañoFormatoVer

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)