A comparative study of feature redundancy and interpretable machine learning models for EEG-based stroke classification

L’electroencefalografia (EEG) s’ha explorat de manera creixent com a eina complementària per a la detecció i la caracterització de l’ictus, gràcies a la seva portabilitat i a la seva elevada resolució temporal. Tanmateix, els fluxos de processament quantitatiu d’EEG solen basar-se en conjunts de car...

Descripción completa

Detalles Bibliográficos
Autor: Valchev, Stoyan
Tipo de recurso: tesis de maestría
Fecha de publicación:2026
País:España
Institución:Universitat Politècnica de Catalunya (UPC)
Repositorio:UPCommons. Portal del coneixement obert de la UPC
Idioma:inglés
OAI Identifier:oai:upcommons.upc.edu:2117/455312
Acceso en línea:https://hdl.handle.net/2117/455312
Access Level:acceso abierto
Palabra clave:Artificial intelligence
Electroencephalography (EEG)
Stroke Classification
Feature Redundancy
Interpretable Machine Learning
Quantitative EEG
Synthetic Data
Model Robustness
Intel·ligència artificial
Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial
Descripción
Sumario:L’electroencefalografia (EEG) s’ha explorat de manera creixent com a eina complementària per a la detecció i la caracterització de l’ictus, gràcies a la seva portabilitat i a la seva elevada resolució temporal. Tanmateix, els fluxos de processament quantitatiu d’EEG solen basar-se en conjunts de característiques d’alta dimensionalitat que presenten una redundància significativa, fet que pot comprometre l’estabilitat, la robustesa i la interpretabilitat dels models, especialment en aplicacions mèdiques crítiques per a la seguretat. Aquesta tesi investiga l’impacte de la redundància de característiques en models d’aprenentatge automàtic interpretables per a la classificació d’ictus basada en EEG. Es proposa un marc experimental controlat en què la redundància es quantifica i es redueix explícitament abans de l’entrenament dels models. S’utilitzen dades d’EEG sintètiques per permetre la manipulació sistemàtica del soroll i del solapament entre característiques, fet que permet aïllar els efectes de la redundància dels factors de confusió clínics. Diversos classificadors interpretables s’avaluen sota condicions idèntiques, i els conjunts de característiques conscients de la redundància es validen addicionalment quant a la seva plausibilitat fisiològica mitjançant dades reals d’EEG d’imatgeria motora. Els resultats demostren que la redundància de característiques influeix de manera significativa en la robustesa i l’estabilitat dels models. La reducció de la redundància millora la consistència del rendiment en classificadors lineals, especialment en condicions sorolloses, mentre que té efectes més limitats en models basats en arbres. Aquests resultats indiquen que la redundància de característiques constitueix una variable de disseny crítica en els fluxos de processament quantitatiu d’EEG i que hauria de ser abordada explícitament, en lloc de ser tractada com una qüestió secundària de preprocessament. Tot i que aquest treball no pretén establir validesa clínica, aporta coneixements metodològics rellevants per al desenvolupament de sistemes de suport a la decisió basats en EEG que siguin robustos i interpretables.