Machine learning on complex networks: dynamical fingerprints, embeddings and feature engineering = Aprendizaje automático en redes complejas: huellas digitales dinámicas, embeedings e ingeniería de características
Abstract:
Complex networks emerge as a natural framework to describe real-life phenomena involving a group of entities and their interactions, i.e., a social net-work. Furthermore, other problems involve a collection of networks, such as multi-layer, temporal, or brain networks (connectomes). With the increasing availability of graph-shaped data and associated meta-data, i.e., node or edge attributes, machine learning (ML) techniques on networks have risen in popularity. However, there are still several challenging issues to be addressed concerning feature engineering, graph representation, visualization, and general graph mining applications. This thesis contributes to bridging the gap between ML and complex net-works. We investigate dynamics on networks such as discrete and continuous- time random walks, in two directions. First, we develop a multi-scale anomaly detection algorithm on attributed networks. We exploit the link between graph signal processing and the Markov stability framework used in community detection, for spotting anomalous nodes in multiple contexts of the network. Second, we introduce a generalization of assortativity on networks operating on scalar and categorical node attributes. These coefficients turn out to be useful descriptors to build network fingerprints, so that we can perform supervised graph classification, i.e., predicting the toxicity of molecules or classifying Reddit discussion threads. Besides, we develop an unsupervised approach to learn graph embeddings from a collection of networks. By learning a non-linear mapping from input graphs to a lower-dimensional feature space, we obtain useful graphs representations used in graph visualization, clustering, and classification, e.g., predicting people’s gender based on their structural connectome. Finally, we propose a principled approach to identify stable biomarkers for schizophrenia diagnosis in the human connectome. From an ML perspective, the problem is stated as an embedded feature selection scheme for graph classification. By doing so, we identify the affected-core in schizophrenia, highlighting increasing performance when structural and functional neural features are combined.
Resumen:
Las redes complejas emergen como marco general en la descripción de problemas reales que incluyen entidades y sus interacciones, ex., redes sociales. Además, otros problemas incluyen colecciones de redes tales como redes multi nivel, redes temporales o redes del cerebro. Con el incremento de la disponibilidad de datos en forma de grafos y metadatos asociados, ex., atributos en nodos o ejes, técnicas de aprendizaje automático en redes han incrementado en popularidad. Sin embargo, múltiples desafíos siguen aún sin ser resueltos, relacionados con representación de grafos, ingeniería de características en grafos, visualización y aplicaciones generales de minería de datos sobre grafos. Esta tesis doctoral contribuye a cerrar la brecha entre dos campos del conocimiento emergentes: aprendizaje automático y ciencia de redes. En esta tesis se investigan sistemas dinámicos sobre redes en la extracción de características estructurales en redes y se introduce una generalización de asortatividad en redes. Dicha asortatividad permite definir descriptores de grafos útiles en la construcción de huellas digitales de redes utilizadas en problemas de aprendizaje supervisado en clasificación de grafos, ex., predicción de toxicidad en moléculas o clasificación de redes sociales Reddit. Además, esta tesis propone un nuevo método no supervisado para crear embeedings de grafos. Gracias a la estimación de una función no lineal, se puede mapear grafos enteros en espacios euclideanos, preservando la similaridad entre grafos de origen. Finalmente, se propone un algoritmo para el diagnóstico de esquizofrenia en el cerebro humano usando connectomes, destacando las regiones del cerebro afectadas por la enfermedad mostrando resultados de alta confiabilidad utilizando distintas representaciones neuronales.
Citación recomendada (normas APA)
Efraín Leonardo Gutiérrez Gómez, "Machine learning on complex networks: dynamical fingerprints, embeddings and feature engineering = Aprendizaje automático en redes complejas: huellas digitales dinámicas, embeedings e ingeniería de características", Colombia:-, 2019. Consultado en línea en la Biblioteca Digital de Bogotá (https://www.bibliotecadigitaldebogota.gov.co/resources/3711282/), el día 2025-05-02.
Selecciona las Colecciones en las que vas a añadir el contenido
Para consultar los contenidos añadidos busca la opción
Tus colecciones en el menú principal o en
Mi perfil.
Mis colecciones
Cargando colecciones
Compartir este contenido
Machine learning on complex networks: dynamical fingerprints, embeddings and feature engineering = Aprendizaje automático en redes complejas: huellas digitales dinámicas, embeedings e ingeniería de características