Abstract:
Campylobacter infections are the main bacterial cause of gastroenteritis in the UK, causing an estimated 500 thousand cases per year. Health authorities investigate outbreaks to identify the source, control the spread and understand the cause. Outbreak detection mechanisms are potentially improved by the increasing availability of whole-genome sequence alongside other epidemiological data. However, techniques mixing genomics and other epidemiological factors are still underdeveloped. This project aims to develop and apply outbreak detection methods using surveillance data collected from two regions in the UK. The approaches proposed in this thesis are based on an existing spatialtemporal Bayesian hierarchical model, where cases are labelled as potential outbreaks if they comprise an elevated number of cases compared to the expected sporadic count. The model is adjusted to include genetic data using Gaussian random fields, exploiting the capacity of whole-genome sequencing to discriminate closely related isolates. Moreover, a Markov Chain Monte Carlo algorithm is implemented to obtain the posterior distribution of the model parameters. In particular, a sampling strategy is proposed to improve the convergence of the chain for the parameters describing the Gaussian random field. The project dataset is analysed using a spatial-temporal, a spatial-genetic and a temporalgenetic version of the model, where each version explores different types of outbreaks. The proposed approach demonstrates how to organise genetic sequences into a highdimensional structure and incorporate them into a Bayesian framework. Also, the MCMC sampling algorithm improves the mixing of the chain to estimate the posterior distribution of the model parameters. Finally, all model versions provide the probability that each reported infection is part of a potential outbreak. Comparing the potential outbreaks found by each model provides insights to estimate the real outbreaks. It also identifies cases that are potentially part of a diffuse real outbreak hard to detect by existing approaches. Despite the capability of the model, it requires predefined outbreak sizes and therefore is not flexible at capturing many shapes. Autocorrelated models are a potential improvement to be explored.
Resumen:
Las infecciones por Campylobacter son la principal causa bacteriana de gastroenteritis en el Reino Unido, provocando un estimado de 500 mil casos por año. Las autoridades sanitarias investigan los brotes para identificar la fuente, controlar la propagación y comprender la causa. Los mecanismos de detección de brotes se mejoran potencialmente con la creciente disponibilidad de datos del genoma completo de las bacterias junto con otros datos epidemiológicos. Sin embargo, las técnicas que combinan genética y otros factores epidemiológicos aún están poco desarrolladas. Este proyecto tiene como objetivo
desarrollar y aplicar métodos de detección de brotes utilizando datos de vigilancia recopilados en dos regiones del Reino Unido. Los enfoques propuestos en esta tesis se basan en un modelo jerárquico bayesiano espacio-temporal existente, donde los casos se etiquetan como brotes potenciales si presentan un número elevado de casos mayor al recuento esporádico esperado. El modelo se ajusta para incluir datos genéticos utilizando campos aleatorios Gaussianos, aprovechando la capacidad del genoma completo para discriminar casos estrechamente relacionados. Además, se implementa usando
algoritmos de Markov Chain Monte Carlo para obtener la distribución posterior de los parámetros del modelo. En particular, se propone una estrategia de muestreo para mejorar la convergencia de la cadena de Markov para los parámetros del campo Gaussiano. El conjunto de datos del proyecto se analiza utilizando una versión espacial temporal, una espacial-genética y una temporal-genética del modelo, donde cada versión explora diferentes tipos de brotes. El enfoque propuesto demuestra cómo organizar secuencias genéticas en una estructura de múltiples dimensiones e incorporarlas en un marco bayesiano. Además, el algoritmo de muestreo MCMC mejora la mezcla de la cadena para estimar la distribución posterior de los parámetros del modelo. Por último, todas las versiones del modelo estiman la probabilidad de que cada infección sea parte de un posible brote. La comparación entre los posibles brotes encontrados por cada modelo proporciona información para estimar cuáles son los brotes reales. También identifica casos que son potencialmente parte de un brote real difícil de detectar por los enfoques existentes. A pesar de las múltiples ventajas del modelo, este requiere tamaños de brotes predefinidos y, por lo tanto, no es flexible para capturar brotes de formas irregulares. Los modelos autocorrelacionados proveen una mejora potencial para el modelo que debe explorarse.
Citación recomendada (normas APA)
Laura Marcela Guzmán Rincón, "Statistical Methods for Campylobacter Outbreak Detection using Genomics and Epidemiological Data", Reino Unido:-, 2021. Consultado en línea en la Biblioteca Digital de Bogotá (https://www.bibliotecadigitaldebogota.gov.co/resources/3711521/), el día 2025-05-25.
¡Disfruta más de la BDB!
Explora contenidos digitales de forma gratuita, crea tus propias colecciones, colabora y comparte con otros.