dc.contributor
Universitat Politècnica de Catalunya. Departament d'Enginyeria Minera, Industrial i TIC
dc.contributor
Rodriguez Rivero, Cristian Maximiliano
dc.contributor
Rajan, Ginu
dc.contributor.author
Valchev, Stoyan
dc.date.issued
2026-01-20
dc.identifier
https://hdl.handle.net/2117/455312
dc.identifier
PRISMA-200767
dc.description.abstract
L’electroencefalografia (EEG) s’ha explorat de manera creixent com a eina complementària
per a la detecció i la caracterització de l’ictus, gràcies a la seva portabilitat i a la seva
elevada resolució temporal. Tanmateix, els fluxos de processament quantitatiu d’EEG solen
basar-se en conjunts de característiques d’alta dimensionalitat que presenten una redundància
significativa, fet que pot comprometre l’estabilitat, la robustesa i la interpretabilitat dels
models, especialment en aplicacions mèdiques crítiques per a la seguretat.
Aquesta tesi investiga l’impacte de la redundància de característiques en models d’aprenentatge
automàtic interpretables per a la classificació d’ictus basada en EEG. Es proposa un marc
experimental controlat en què la redundància es quantifica i es redueix explícitament abans de
l’entrenament dels models. S’utilitzen dades d’EEG sintètiques per permetre la manipulació
sistemàtica del soroll i del solapament entre característiques, fet que permet aïllar els efectes de
la redundància dels factors de confusió clínics. Diversos classificadors interpretables s’avaluen
sota condicions idèntiques, i els conjunts de característiques conscients de la redundància es
validen addicionalment quant a la seva plausibilitat fisiològica mitjançant dades reals d’EEG
d’imatgeria motora.
Els resultats demostren que la redundància de característiques influeix de manera significativa
en la robustesa i l’estabilitat dels models. La reducció de la redundància millora la consistència
del rendiment en classificadors lineals, especialment en condicions sorolloses, mentre que té
efectes més limitats en models basats en arbres. Aquests resultats indiquen que la redundància
de característiques constitueix una variable de disseny crítica en els fluxos de processament
quantitatiu d’EEG i que hauria de ser abordada explícitament, en lloc de ser tractada com una
qüestió secundària de preprocessament. Tot i que aquest treball no pretén establir validesa
clínica, aporta coneixements metodològics rellevants per al desenvolupament de sistemes de
suport a la decisió basats en EEG que siguin robustos i interpretables.
dc.description.abstract
Electroencephalography (EEG) has been increasingly explored as a complementary tool for stroke detection and characterization due to its portability and high temporal resolution. However, quantitative EEG pipelines typically rely on high-dimensional feature sets that exhibit substantial redundancy, potentially impairing model stability, robustness, and interpretability, particularly in safety-critical medical applications. This thesis investigates the impact of feature redundancy on interpretable machine learning models for EEG-based stroke classification. A controlled experimental framework is proposed in which redundancy is explicitly quantified and reduced prior to model training. Synthetic EEG data are employed to enable systematic manipulation of noise and feature overlap, allowing redundancy effects to be isolated from clinical confounders. Multiple interpretable classifiers are evaluated under identical conditions, and redundancy-aware feature sets are further assessed for physiological plausibility using real EEG motor imagery data. The results demonstrate that feature redundancy meaningfully influences model robustness and stability, with redundancy reduction improving performance consistency in linear classifiers, particularly under noisy conditions, while having more limited effects on tree-based models. These findings indicate that feature redundancy constitutes a critical design variable in quantitative EEG pipelines and should be addressed explicitly rather than treated as a secondary preprocessing concern. While not intended to establish clinical validity, this work provides methodological insights relevant to the development of robust and interpretable EEG-based decision support systems.
dc.format
application/pdf
dc.publisher
Universitat Politècnica de Catalunya
dc.rights
http://creativecommons.org/licenses/by-sa/4.0/
dc.rights
Attribution-ShareAlike 4.0 International
dc.subject
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial
dc.subject
Artificial intelligence
dc.subject
Electroencephalography (EEG)
dc.subject
Stroke Classification
dc.subject
Feature Redundancy
dc.subject
Interpretable Machine Learning
dc.subject
Quantitative EEG
dc.subject
Synthetic Data
dc.subject
Model Robustness
dc.subject
Intel·ligència artificial
dc.title
A comparative study of feature redundancy and interpretable machine learning models for EEG-based stroke classification