Patogénesis y evolución por medio de corredores de selección: una mirada desde el análisis topológico de datos
https://supercontra.blogspot.com/2018/09/patogenesis-y-evolucion-por-medio-de.html
Una de las técnicas más novedosas en el análisis de datos, que con el auge del big data ha tomado vuelo propio, es el análisis topológico de datos (mejor conocido como TDA, por su sigla en inglés). Es una técnica que consiste en investigar las propiedades estructurales de los datos para encontrar clusters en datos multidimensionales, y además sus conexiones. En mi opinión, uno de los mejores ejemplos para ilustrar la técnica es el caso de muchos puntos que en conjunto forman una mano, pero cuya "forma" es desconocida para los investigadores. El algoritmo usa una función filtro y una medida de distancia, para luego hacer inferencia sobre la estructura subyacente en los datos.
Si bien el ejemplo es simple por su propósito didáctico, ilustra una técnica que ha tenido resultados asombrosos en temas tan diversos como la medicina, las ciencias del deporte, y las redes de internet, por solo mencionar algunos. En medicina, por ejemplo, se han logrado identificar subgrupos de personas que presentan una clínica particular y que requiere tratamiento específico en diabetes con base en datos de paciente y pruebas diagnósticas. También, se han identificado factores genéticos que determinan la eficacia de un medicamento para diferentes enfermedades, la configuración óptima de equipos de deportes variados, y se han identificado las diferencias partidistas en redes de contactos en Twitter, por solo mencionar algunas de las múltiples aplicaciones que tiene la técnica.
En un artículo reciente, en conjunto con Felipe González, Andrés Ángel y Camilo Rivera, identificamos las diferentes regiones maláricas en Colombia con un análisis de TDA. El algoritmo, donde analizamos la relación entre las series de tiempo de todas las parejas posibles de municipios del país, identificó acertadamente los lugares con diferentes perfiles epidemiológicos (tanto por etnicidad, como en la tendencia de la incidencia de malaria).
Adicionalmente, por petición de uno de un revisor del artículo, analizamos los cambios de cobertura y de uso de suelo en el país, y encontramos que hay una estrecha relación con las dinámicas de la malaria. En pocas palabras, la malaria se incrementó donde hay más minería y deforestación moderada, y se redujo en lugares con cambio antrópico moderado y medio. Esto quiere decir que la política de extracción minera debe estar asociada a programas de salud pública, y que programas del gobierno asociados a cambios de usos de suelo tienen un potencial enorme para reducir la carga de la enfermedad.
Dado que los resultados fueron tan positivos, de momento estamos utilizando los mismos métodos para analizar las dinámicas de transmisión a una escala micro-territorial. Para ello, trabajamos con Vladimir Corredor, profesor de genética en la escuela de salud pública de la Universidad Nacional, y con un equipo que incluye a Pablo Cárdenas y Manuela Carrasquilla, y a varios colaboradores en el instituto Sanger (algo así como la Nasa de la malaria) y a colaboradores de Harvard y MIT.
El objetivo de la investigación a nivel microterritorial es analizar la relación existente entre las dinámicas epidemiológicas y la variabilidad genética del parásito. Esto es relevante porque Colombia, a pesar de no ser un país donde la malaria causa muchas muertes (comparado con África), es el lugar donde el parásito ha desarrollado resistencia a los antimaláricos. La malaria es la enfermedad que más muertes ha causado en la historia de la humanidad, y ha sido gracias a tratamiento oportuno que se ha podido reducir la carga que representa a nivel mundial. Si se desarrolla resistencia a los tratamientos derivados de la artemisina, como ya se ha visto en el sudéste asiático, estaríamos ante una de las mayores emergencias humanitarias que se hayan conocido en salud pública.
Resultados:
Cada nodo en el grafo representa un cluster de casos que el algoritmo identifica como una sub-población. Las conexiones entre nodos representan un caso que está presente en dos clusters (el algoritmo de TDA necesita que los clusters estén sobrelapados, de manera que las intersecciones entre dichos clusters serán casos asignados a ambos nodos). El tamaño de los nodos representa el número de casos, y el color, la mezcla de cada sub-población (dado que se identifican 3 poblaciones genéticamente diferenciadas, usamos RGB para representarlas).
Como podemos observar en la siguiente gráfica animada, existe un aislamiento geográfico de las sub-poblaciones de malaria en la región de Guapi. Durante los eventos epidémicos, estas poblaciones, relativamente aisladas, se tornan en poblaciones simpátricas, es decir, existe cierto nivel de aislamiento entre ellas a pesar de que se mezclan en el espacio. Sin embargo, en los eventos epidémicos, el algoritmo de TDA identifica una sola población compuesta por todos los casos combinados (a diferencia de las poblaciones aisladas y clonales cuando no hay eventos epidémicos).
Como conclusión, los eventos epidémicos aumentan la conectividad entre sub-poblaciones que, de otra manera, están aisladas y son clonales. Esto promueve la recombinación, y por ende, la acumulación de mutaciones, lo cual es el camino para el desarrollo de resistencia a los antimaláricos. Con estos datos, hemos explorado la relación entre la epidemiología y la genética de la malaria, para identificar las trayectorias evolutivas del parásito. Sin duda, hay mucho camino por recorrer, pero este es un paso importante para entender lo que a mi juicio es la problemática más importante (en el gran esquema) de la malaria en Colombia: la manera como emergen parásitos resistentes en el país.
Post a Comment