A comparative study of feature redundancy and interpretable machine learning models for EEG-based stroke classification

dc.contributor
Universitat Politècnica de Catalunya. Departament d'Enginyeria Minera, Industrial i TIC
dc.contributor
Rodriguez Rivero, Cristian Maximiliano
dc.contributor
Rajan, Ginu
dc.contributor.author
Valchev, Stoyan
dc.date.issued
2026-01-20
dc.identifier
https://hdl.handle.net/2117/455312
dc.identifier
PRISMA-200767
dc.description.abstract
L’electroencefalografia (EEG) s’ha explorat de manera creixent com a eina complementària per a la detecció i la caracterització de l’ictus, gràcies a la seva portabilitat i a la seva elevada resolució temporal. Tanmateix, els fluxos de processament quantitatiu d’EEG solen basar-se en conjunts de característiques d’alta dimensionalitat que presenten una redundància significativa, fet que pot comprometre l’estabilitat, la robustesa i la interpretabilitat dels models, especialment en aplicacions mèdiques crítiques per a la seguretat. Aquesta tesi investiga l’impacte de la redundància de característiques en models d’aprenentatge automàtic interpretables per a la classificació d’ictus basada en EEG. Es proposa un marc experimental controlat en què la redundància es quantifica i es redueix explícitament abans de l’entrenament dels models. S’utilitzen dades d’EEG sintètiques per permetre la manipulació sistemàtica del soroll i del solapament entre característiques, fet que permet aïllar els efectes de la redundància dels factors de confusió clínics. Diversos classificadors interpretables s’avaluen sota condicions idèntiques, i els conjunts de característiques conscients de la redundància es validen addicionalment quant a la seva plausibilitat fisiològica mitjançant dades reals d’EEG d’imatgeria motora. Els resultats demostren que la redundància de característiques influeix de manera significativa en la robustesa i l’estabilitat dels models. La reducció de la redundància millora la consistència del rendiment en classificadors lineals, especialment en condicions sorolloses, mentre que té efectes més limitats en models basats en arbres. Aquests resultats indiquen que la redundància de característiques constitueix una variable de disseny crítica en els fluxos de processament quantitatiu d’EEG i que hauria de ser abordada explícitament, en lloc de ser tractada com una qüestió secundària de preprocessament. Tot i que aquest treball no pretén establir validesa clínica, aporta coneixements metodològics rellevants per al desenvolupament de sistemes de suport a la decisió basats en EEG que siguin robustos i interpretables.
dc.description.abstract
Electroencephalography (EEG) has been increasingly explored as a complementary tool for stroke detection and characterization due to its portability and high temporal resolution. However, quantitative EEG pipelines typically rely on high-dimensional feature sets that exhibit substantial redundancy, potentially impairing model stability, robustness, and interpretability, particularly in safety-critical medical applications. This thesis investigates the impact of feature redundancy on interpretable machine learning models for EEG-based stroke classification. A controlled experimental framework is proposed in which redundancy is explicitly quantified and reduced prior to model training. Synthetic EEG data are employed to enable systematic manipulation of noise and feature overlap, allowing redundancy effects to be isolated from clinical confounders. Multiple interpretable classifiers are evaluated under identical conditions, and redundancy-aware feature sets are further assessed for physiological plausibility using real EEG motor imagery data. The results demonstrate that feature redundancy meaningfully influences model robustness and stability, with redundancy reduction improving performance consistency in linear classifiers, particularly under noisy conditions, while having more limited effects on tree-based models. These findings indicate that feature redundancy constitutes a critical design variable in quantitative EEG pipelines and should be addressed explicitly rather than treated as a secondary preprocessing concern. While not intended to establish clinical validity, this work provides methodological insights relevant to the development of robust and interpretable EEG-based decision support systems.
dc.format
application/pdf
dc.language
eng
dc.publisher
Universitat Politècnica de Catalunya
dc.rights
http://creativecommons.org/licenses/by-sa/4.0/
dc.rights
Open Access
dc.rights
Attribution-ShareAlike 4.0 International
dc.subject
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial
dc.subject
Artificial intelligence
dc.subject
Electroencephalography (EEG)
dc.subject
Stroke Classification
dc.subject
Feature Redundancy
dc.subject
Interpretable Machine Learning
dc.subject
Quantitative EEG
dc.subject
Synthetic Data
dc.subject
Model Robustness
dc.subject
Intel·ligència artificial
dc.title
A comparative study of feature redundancy and interpretable machine learning models for EEG-based stroke classification
dc.type
Master thesis


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)