Abstract:
The Fourth Industrial Revolution has increased data exchange among organizations, creating security and privacy concerns. Federated Learning (FL) has emerged as a popular approach to address these challenges by enabling privacy-preserving machine learning (ML) on sensitive data. FL is an ML approach where models are trained locally on decentralized data, allowing organizations to collaborate and learn from each other’s data without sharing it, thereby ensuring data privacy and security. This thesis explores the application of FL for arrhythmia classification based on 12-lead ECGs while preserving medical records privacy. The performance of the FL models is evaluated under different degrees of heterogeneity in client labels, so-called Independent and Identically distributed or IID. The methodology involves a global server coordinating local modules and a four-step processing pipeline, where the local models’ weights are aggregated at the global server, and the resulting model is sent back to the clients (hospitals). The study achieves competitive classification performance for IID and non-IID data, along with a 28% reduction in training time compared to state-of-the-art methods. The findings have implications for privacy-preserving ML and early detection and diagnosis of cardiac diseases. Finally, the thesis demonstrates the FL’s effectiveness for accurate arrhythmia classification while preserving medical records’ privacy, making it a valuable tool in healthcare applications and contributing to advancing the Data Science field.
Resumen:
La Cuarta Revolución Industrial ha aumentado el intercambio de datos entre organizaciones, generando preocupaciones en cuanto a seguridad y privacidad. El Aprendizaje Federado (AF) ha surgido como un enfoque popular para abordar estos desafíos al permitir el aprendizaje automático (AA) preservando la privacidad en datos sensibles. El AF es un enfoque de AA en el que los modelos se entrenan localmente en datos descentralizados, lo que permite a las organizaciones colaborar y aprender de los datos de los demás sin compartirlos, garantizando así la privacidad y seguridad de los datos. Esta tesis explora la aplicación del AF para la clasificación de arritmias basada en electrocardiogramas (ECG) de 12 derivaciones, preservando al mismo tiempo la privacidad de los registros médicos. El rendimiento de los modelos de AF se evalúa bajo diferentes grados de heterogeneidad en las etiquetas de los clientes, conocido como Independiente e Idénticamente Distribuido o IID. La metodología implica un servidor global que coordina módulos locales y un proceso de cuatro pasos, donde los pesos de los modelos locales se agregan en el servidor global, y el modelo resultante se envía de vuelta a los clientes (hospitales). El estudio logra un rendimiento de clasificación competitivo para datos IID y no IID, junto con una reducción del 28% en el tiempo de entrenamiento en comparación con los métodos más avanzados. Los hallazgos tienen implicaciones para el AA preservando la privacidad y la detección temprana y diagnóstico de enfermedades cardíacas. Finalmente, la tesis demuestra la eficacia del AF para una clasificación precisa de arritmias preservando la privacidad de los registros médicos, convirtiéndolo en una herramienta valiosa en aplicaciones de atención médica y contribuyendo al avance del campo de la Ciencia de Datos.
Citación recomendada (normas APA)
Daniel Mauricio Jiménez Gutiérrez, "Federated Learning for 12-leads ECG arrhythmia classification: Preserving medical records privacy", Colombia:-, 2022. Consultado en línea en la Biblioteca Digital de Bogotá (https://www.bibliotecadigitaldebogota.gov.co/resources/3711888/), el día 2025-05-05.
¡Disfruta más de la BDB!
Explora contenidos digitales de forma gratuita, crea tus propias colecciones, colabora y comparte con otros.