Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors
Rodríguez Luna, Eva
Otero Calviño, Beatriz
2025-06-27
Els Sistemes de Detecció d'Intrusions (IDS) per a entorns IoT-5G enfronten reptes a causa de les preocupacions sobre la privacitat de les dades i la seva heterogeneïtat. Per abordar-los, proposem un IDS de dues etapes que preserva la privacitat, aprofitant models d'Aprenentatge Profund (DL) entrenats mitjançant Aprenentatge Federat (FL) a través de tres nodes locals distribuïts. Cada node incorpora Privacitat Diferencial (DP) per protegir les dades sensibles. La nostra arquitectura realitza de forma seqüencial la Detecció d'Atacs (AD) i la seva Classificació de forma més minuciosa (AC), permetent una anàlisi d'amenaces escalable i interpretable adequada a aquests sistemes heterogenis. Els experiments s'han dut a terme utilitzant el conjunt de dades basat en fluxos de xarxa "CIC IoT 2023", que conté 33 tipus de ciberatacs juntament amb trànsit benigne. S'han explorat dues configuracions de partició de dades: una distribució uniforme on cada node observa tots els tipus d'atac, i una distribució desbalancejada on els nodes només tenen accés a un subconjunt de tipus d'atacs. Els resultats mostren que les Xarxes Neuronals Convolucionals (CNN) superen consistentment els altres models, especialment utilitzant la mitjana geomètrica com a tècnica agregació robusta. En la configuració uniforme, l'IDS basat en FL assoleix un Coeficient de Correlació de Matthews (MCC) del 90.62% per a la detecció d'atacs i del 75.60% per a la classificació. En canvi, en la no uniforme, malgrat que el rendiment de detecció es manté estable (90.50% MCC), el de la classificació cau fins al 69.24%, reflectint l'impacte de l'heterogeneïtat de les dades. La incorporació de DP amb un nivell de privacitat moderat-alt comporta només una disminució del 2% en la precisió de la detecció, però del 15% en la de classificació. Tot i això, els baixos índexs Senyal-Soroll (SNR) resultants confirmen fortes garanties de privacitat. Aquests resultats demostren la viabilitat de combinar FL amb DP per assolir un IDS acurat, escalable i que manté la privacitat en entorns IoT-5G descentralitzats.
Intrusion Detection Systems (IDS) for IoT-5G environments face challenges due to data privacy concerns and data heterogeneity. To address these, we propose a two-stage, privacy-preserving IDS leveraging Deep Learning (DL) models trained via Federated Learning (FL) across three distributed local nodes. Each node employs Differential Privacy (DP) to safeguard sensitive data. Our architecture performs sequential Attack Detection (AD) and fine-grained Attack Classification (AC), enabling scalable, interpretable threat analysis for heterogeneous IoT systems. Experiments were conducted using the "CIC IoT 2023" flow-based dataset, containing 33 cyberattack types alongside benign traffic. Two data partitioning settings were explored: a uniform distribution where each node observes all attack types, and an unbalanced distribution where nodes had access to only subsets of attack types. Results shown that Convolutional Neural Networks (CNNs) consistently outperformed other DL models, particularly with the geometric median as a robust aggregation. In the uniform setting, the FL-based IDS achieved a Matthews Correlation Coefficient (MCC) of 90.62% for attack detection and 75.60% for classification. In the non-uniform setting, detection performance remained stable (90.50% MCC), while classification dropped to 69.24%, reflecting the impact of data heterogeneity. Introducing DP with a moderate-high privacy budget led to only a 2% drop in detection accuracy and a 15% decline in classification accuracy. Despite this, the resulting low Signal-to-Noise Ratios (SNR) confirmed strong privacy guarantees. These findings demonstrate the feasibility of combining FL and DP for accurate, scalable, and privacy-preserving IDSs in decentralized IoT-5G infrastructures.
Bachelor thesis
English
Computer security; Machine learning; Deep learning (Machine learning); 5G mobile communication systems; Sistema de Detecció d'Intrusions (IDS); Aprenentatge Federat (FL); Entrenament col·laboratiu; Detecció d'Atacs (AD); Classificació d'Atacs (AC); Xarxes 5G; Internet de les Coses (IoT); Aprenentatge Automàtic (ML); Aprenentatge Profund (DL); Xarxa Neuronal Convolucional (CNN); Xarxa Neuronal Profunda (DNN); Memòria a Curt i Llarg Termini (LSTM); Privacitat Diferencial (DP); Pressupost de Privacitat; Llindar de Retallada; Conjunt de Dades; CIC-IoT 2023; Funció d'Agregació Robusta; Coeficient de Correlació de Matthews (MCC); Relació Senyal-Soroll (SNR); Intrusion Detection System (IDS); Federated Learning (FL); collaborative training; Attack Detection (AD); Attack Classification (AC); 5G networks; Internet of Things (IoT); Machine Learning (ML); Deep Learning (DL); Convolutional Neural Network (CNN); Deep Neural Network (DNN); Long Short-Term Memory (LSTM); Differential Privacy (DP); Privacy Budget; Clipping Threshold; Dataset; CIC-IoT 2023; Robust Aggregation Function; Matthew Correlation Coefficient (MCC); Sinal-to-Noise Ratio (SNR); Seguretat Informàtica; Aprenentatge automàtic; Aprenentatge profund (Aprenentatge automàtic); Comunicació sense fil, Sistemes 5G de
Universitat Politècnica de Catalunya
Open Access
Treballs acadèmics [82541]