Loading...

Patogénesis y evolución por medio de corredores de selección: una mirada desde el análisis topológico de datos



Una de las técnicas más novedosas en el análisis de datos, que con el auge del big data ha tomado vuelo propio, es el análisis topológico de datos (mejor conocido como TDA, por su sigla en inglés). Es una técnica que consiste en investigar las propiedades estructurales de los datos para encontrar clusters en datos multidimensionales, y además sus conexiones. En mi opinión, uno de los mejores ejemplos para ilustrar la técnica es el caso de muchos puntos que en conjunto forman una mano, pero cuya "forma" es desconocida para los investigadores. El algoritmo usa una función filtro y una medida de distancia, para luego hacer inferencia sobre la estructura subyacente en los datos.



Si bien el ejemplo es simple por su propósito didáctico, ilustra una técnica que ha tenido resultados asombrosos en temas tan diversos como la medicina, las ciencias del deporte, y las redes de internet, por solo mencionar algunos. En medicina, por ejemplo, se han logrado identificar subgrupos de personas que presentan una clínica particular y que requiere tratamiento específico en diabetes con base en datos de paciente y pruebas diagnósticas. También, se han identificado factores genéticos que determinan la eficacia de un medicamento para diferentes enfermedades, la configuración óptima de equipos de deportes variados, y se han identificado las diferencias partidistas en redes de contactos en Twitter, por solo mencionar algunas de las múltiples aplicaciones que tiene la técnica. 


En un artículo reciente, en conjunto con Felipe González, Andrés Ángel y Camilo Rivera, identificamos las diferentes regiones maláricas en Colombia con un análisis de TDA. El algoritmo, donde analizamos la relación entre las series de tiempo de todas las parejas posibles de municipios del país, identificó acertadamente los lugares con diferentes perfiles epidemiológicos (tanto por etnicidad, como en la tendencia de la incidencia de malaria). 






Adicionalmente, por petición de uno de un revisor del artículo, analizamos los cambios de cobertura y de uso de suelo en el país, y encontramos que hay una estrecha relación con las dinámicas de la malaria. En pocas palabras, la malaria se incrementó donde hay más minería y deforestación moderada, y se redujo en lugares con cambio antrópico moderado y medio. Esto quiere decir que la política de extracción minera debe estar asociada a programas de salud pública, y que programas del gobierno asociados a cambios de usos de suelo tienen un potencial enorme para reducir la carga de la enfermedad.





Dado que los resultados fueron tan positivos, de momento estamos utilizando los mismos métodos para analizar las dinámicas de transmisión a una escala micro-territorial. Para ello, trabajamos con Vladimir Corredor, profesor de genética en la escuela de salud pública de la Universidad Nacional, y con un equipo que incluye a Pablo Cárdenas y Manuela Carrasquilla, y a varios colaboradores en el instituto Sanger (algo así como la Nasa de la malaria) y a colaboradores de Harvard y MIT.

El objetivo de la investigación a nivel microterritorial es analizar la relación existente entre las dinámicas epidemiológicas y la variabilidad genética del parásito. Esto es relevante porque Colombia, a pesar de no ser un país donde la malaria causa muchas muertes (comparado con África), es el lugar donde el parásito ha desarrollado resistencia a los antimaláricos. La malaria es la enfermedad que más muertes ha causado en la historia de la humanidad, y ha sido gracias a tratamiento oportuno que se ha podido reducir la carga que representa a nivel mundial. Si se desarrolla resistencia a los tratamientos derivados de la artemisina, como ya se ha visto en el sudéste asiático, estaríamos ante una de las mayores emergencias humanitarias que se hayan conocido en salud pública.

Gracias a este grupo tan selecto, logramos ensamblar una gran cantidad de datos genómicos del parásito para el área de estudio de Guapi, donde tuvo lugar la recolección de datos. El ensamblaje de datos genómicos a gran escala es uno de los retos computacionales más grandes que tiene la bioinformática contemporánea, por lo cual fue necesario implementar "tubos" de datos para construir la base de datos con la cual se pudiera hacer un análisis de TDA. Con base en la información genómica, analizamos los diferentes clusters de malaria (en lugar de analizar la serie de tiempo para cada punto geográfico, usamos la secuencia genética de cada caso). Para ser más precisos, usamos las distancias genéticas y proyectamos sobre ventanas dinámicas en el tiempo, para encontrar las diferentes sub-poblaciones del parásito en el tiempo y el espacio, y lo que es más importante, las relaciones entre dichas sub-poblaciones.

Resultados:

Cada nodo en el grafo representa un cluster de casos que el algoritmo identifica como una sub-población. Las conexiones entre nodos representan un caso que está presente en dos clusters (el algoritmo de TDA necesita que los clusters estén sobrelapados, de manera que las intersecciones entre dichos clusters serán casos asignados a ambos nodos).  El tamaño de los nodos representa el número de casos, y el color, la mezcla de cada sub-población (dado que se identifican 3 poblaciones genéticamente diferenciadas, usamos RGB para representarlas).


Como podemos observar en la siguiente gráfica animada, existe un aislamiento geográfico de las sub-poblaciones de malaria en la región de Guapi. Durante los eventos epidémicos, estas poblaciones, relativamente aisladas, se tornan en poblaciones simpátricas, es decir, existe cierto nivel de aislamiento entre ellas a pesar de que se mezclan en el espacio. Sin embargo, en los eventos epidémicos, el algoritmo de TDA identifica una sola población compuesta por todos los casos combinados (a diferencia de las poblaciones aisladas y clonales cuando no hay eventos epidémicos).


Como conclusión, los eventos epidémicos aumentan la conectividad entre sub-poblaciones que, de otra manera, están aisladas y son clonales. Esto promueve la recombinación, y por ende, la acumulación de mutaciones, lo cual es el camino para el desarrollo de resistencia a los antimaláricos. Con estos datos, hemos explorado la relación entre la epidemiología y la genética de la malaria, para identificar las trayectorias evolutivas del parásito. Sin duda, hay mucho camino por recorrer, pero este es un paso importante para entender lo que a mi juicio es la problemática más importante (en el gran esquema) de la malaria en Colombia: la manera como emergen parásitos resistentes en el país.

opinión 6141958939269559093

Post a Comment

Home item

Featured Post

Duelos Sin Fronteras

  Desprevenidamente contesté el teléfono ante un número desconocido. - Buenas tardes, ¿hablo con el señor Alejandro? - ¿para qué lo necesita...

Popular Posts

Click to read Read more View all said: Related posts Default Comments Menu