AIdeosincracia y Memocracia
Si una constante parecen tener todos los gobiernos nacionales desde Uribe, es que sus mandatarios se desconectaron tanto de la realidad que pensaron que podrían arrasar en un plebiscito en contra de la oposición. La soledad del poder, el espejismo del apoyo popular para consolidar una visión, un legado. Todos, sin excepción, pasaron del triunfo en contra de maquinarias políticas, a la ignominia de pensarse como víctimas de campañas de manipulación y desprestigio. Y no porque el loco sea paranoico significa que no lo estén persiguiendo. En el país de las chuzadas y campañas de opinión contra magistrados de las cortes, pruebas de polígrafo y espionaje digital digno de las más recientes entregas de Misión Imposible, si hay una constante es que las fuerzas políticas pasan de ser maestros de manipulación a víctimas de un gran complot en su contra.
¿Dónde estaban durante el gobierno de Duque los grandes estrategas de campañas digitales con microsegmentación de audiencias por rasgos sicométricos? ¿Dónde está ahora el cónclave de fieles influencers que amenazaba con destruir a Alejandro Gaviria como lo habían hecho con Fajardo? Ni gobierno ni oposición parecen encontrar esas habilidades esquivas que se esfumaron en el aire. ¿Ha cambiado algo en el debate o contexto político?
Todos los que hemos tenido la oportunidad de trabajar en el actual gobierno sabemos que más parece un parque temático de Kafka que un proyecto serio donde alguien da pie con bola. Al igual que el gobierno de Donald Trump que no llegó a consumar la colusión con Rusia o el fraude electoral por enviar mensajes claves a números o emails equivocados, el gobierno Petro es un desorden donde el caos parece método, un esfuerzo mancomunado donde cada ministro anuncia lo que no le corresponde, y un presidente consumado en la soledad del poder y su megalomanía por “supuestas” adicciones a la cocaína, el alcohol, y la peor de todas, la dopamina de las redes sociales.
¿Cómo (intentar) medir el termómetro social de un gobierno en medio de tanto caos?
Por un lado, tenemos las encuestas de aprobación, que parecen al igual que en la pandemia, ser cifras de otra era. Agregados burdos que en pleno boom de inteligencia artificial, parecen salir con semanas de retraso ante cualquier escándalo de turno. Por otro, el tsunami de información y alucinaciones de la inteligencia artificial que nos permite responder cualquier pregunta, con peligro de que los datos sean inventados o correspondan a un universo paralelo.
Nada a lo que no fuéramos vulnerables antes del surgimiento de la inteligencia artificial, sin duda: grandes genios con comentarios racistas como el afamado Nobel por describir el DNA, hasta los nuevos autoproclamados prolegómenos del pensamiento humano, Yuval Noah Harari o Malcolm Gladwell que derrochan desconocimiento científico sobre los temas de sus libros, como Donald Trump en el palacio de Buckingham.
Sin embargo, me parece un momento particularmente interesante para comparar las mediciones medievales de encuestas de opinión en contraste con el termómetro de los grandes datos.
En este análisis, utilicé datos de GDELT para medir el sentimiento mediático en Colombia y los comparé con varios indicadores de violencia, como desplazamientos forzados y masacres. GDELT es una herramienta que rastrea millones de artículos de noticias y evalúa el tono de las publicaciones. Al utilizar esta información, pude observar cómo los medios cubren eventos de violencia y momentos de inestabilidad social, y cómo estas coberturas se alinean, o no, con la realidad de los datos en terreno. Mi objetivo era determinar si los picos en la negatividad mediática coinciden con eventos violentos significativos.
Además, para complementar el análisis, estimé los índices de aprobación presidencial utilizando datos históricos y el conocimiento generado por GPT-4, basándome en la evolución de la opinión pública desde 2017 hasta 2024. Estas estimaciones incluyen los niveles de aprobación para presidentes como Juan Manuel Santos, Iván Duque y Gustavo Petro. Con estas proyecciones, pude analizar si los cambios en la aprobación presidencial se correlacionan con el aumento de violencia o con el tono negativo en los medios.
Finalmente, al comparar estas fuentes de datos, tanto los estimados de aprobación presidencial como los eventos de violencia y los datos de GDELT, realicé un análisis de correlación para identificar si existe una relación significativa entre el sentimiento mediático, la popularidad presidencial y los eventos de violencia. Aunque en algunos casos observé patrones alineados, los resultados indicaron que los medios no siempre reflejan fielmente la situación real en áreas afectadas por la violencia, lo que resalta la importancia de integrar múltiples fuentes de datos para una mejor comprensión del contexto colombiano.
Datos de aprobación:
Datos del LLM:
GDELT vs. LLM:
GDELT vs. (LLM + Encuestas)
Combinación de GDELT, LLM y Encuestas:
En el análisis que realicé, combiné el tono mediático de GDELT con los índices de aprobación presidencial estimados, y los resultados se plasmaron en un gráfico que revela elementos clave para entender la dinámica entre el sentimiento de los medios y la opinión pública. Primero, utilicé una línea discontinua azul para representar la aprobación presidencial normalizada a lo largo del tiempo, que refleja cómo la aprobación pública de cada presidente ha variado, en una escala de 0 a 1. Esto me permitió visualizar de manera clara cómo la aprobación fluctuó en los diferentes periodos presidenciales.
El gráfico también incluye una línea discontinua roja que muestra el tono medio de GDELT, también normalizado entre 0 y 1. Esto me permitió observar cómo el sentimiento de los medios varía en relación con los eventos políticos y sociales. Por último, el gráfico presenta una línea sólida verde que representa el puntaje combinado de la aprobación presidencial y el tono mediático, con pesos iguales (0.5 cada uno) asignados inicialmente a ambas variables. Esta línea verde proporciona una visión integrada y suavizada de ambos inputs, lo que permite ver cómo los cambios en la aprobación presidencial y el tono mediático interactúan.
Al analizar la correlación entre las dos variables, obtuve un valor de 0.47, lo que indica una relación positiva moderada. Esto sugiere que, aunque las tendencias del tono mediático y las aprobaciones presidenciales están algo alineadas, también presentan variaciones independientes. El puntaje combinado sigue más de cerca las fluctuaciones en la aprobación presidencial en algunos periodos, pero también ajusta su comportamiento en función de los cambios en el tono de los medios.
En términos de los próximos pasos, uno de los posibles ajustes sería modificar los pesos asignados a cada input. Si encontramos que el tono mediático de GDELT es más influyente en ciertos periodos, podríamos incrementar su peso en el cálculo del puntaje combinado para reflejar mejor su impacto en la percepción pública. Esto permitiría obtener un análisis más fino y ajustado a las dinámicas específicas de cada periodo presidencial.
Violencia:
Para esta sección, exploré el proceso de estimación y análisis de la violencia en Colombia utilizando diferentes enfoques de datos y cómo los combiné en un índice de violencia más robusto. El objetivo de este análisis es proporcionar una visión más completa y precisa de la dinámica de la violencia, integrando diversas fuentes de datos e indicadores.
Datos Utilizados
Para este estudio, conté con tres conjuntos principales de datos: el número de víctimas de masacres en Colombia (https://www.datos.gov.co/dataset/MASACRES/u8eq-92tb/about_data), la cobertura de noticias sobre violencia (medida como porcentaje del total de noticias) y el “tono” medio de estas noticias (un indicador que representa si el contenido es positivo o negativo). Además, generé un puntaje sintético de violencia que refleja las tendencias generales de conflicto en la región. Cada uno de estos enfoques ofrece un ángulo único para entender la violencia y sus representaciones en los medios.
Normalización y Suavizado de los Datos
Primero, los datos sobre el número de víctimas fueron normalizados y suavizados mediante un promedio móvil de 7 días para eliminar la variabilidad excesiva y resaltar las tendencias subyacentes. La normalización me permitió poner todos los indicadores en la misma escala, facilitando la comparación entre variables muy distintas entre sí, como el número de víctimas y el porcentaje de noticias sobre violencia.
También eliminé un outlier en los datos de masacres: un valor que mostraba más de 3000 víctimas en un solo evento. Este tipo de valores extremos puede distorsionar el análisis y ocultar patrones importantes, así que fue mejor excluirlo para obtener un panorama más preciso.
Creación del Puntaje Sintético de Violencia
Dado que quería estimar la violencia de una manera independiente de los datos originales, creé un puntaje de violencia sintético basado en conocimientos históricos y tendencias generales sobre el conflicto en Colombia. Este puntaje incluyó una combinación de una tendencia general creciente (reflejando un aumento esperado en la violencia), una variación estacional y una componente aleatoria para capturar fluctuaciones impredecibles. Este puntaje fue luego normalizado y suavizado para integrarse con los otros indicadores.
Correlación y Creación del Índice Agregado
Calculé la correlación entre todos los métodos: Total de Víctimas, Volumen de Noticias sobre Violencia, Tono Promedio y el Puntaje Sintético de Violencia. Basándome en estas correlaciones, creé un índice agregado utilizando un promedio ponderado de los diferentes métodos. Las ponderaciones se determinaron según las correlaciones observadas, asignando mayor peso a los indicadores más correlacionados entre sí para reflejar mejor la complejidad de la violencia.
Resultados
Finalmente, visualicé el número no normalizado de víctimas junto con las medidas normalizadas de volumen de noticias, tono promedio, puntaje sintético y el índice agregado. Esta visualización combinada proporciona una perspectiva enriquecida que combina datos de fuentes directas (número de víctimas) y percepciones mediáticas (noticias y tono), así como una estimación basada en patrones históricos. El índice agregado representa una herramienta útil para captar la evolución de la violencia en Colombia a lo largo del tiempo, integrando información diversa y proporcionando una vista general más robusta.
Los resultados muestran que la violencia en Colombia tiene patrones complejos que no siempre se reflejan de manera lineal en los datos de masacres o en la cobertura de los medios. El índice agregado revela tendencias subyacentes que podrían pasar desapercibidas si se analizan los indicadores de manera individual. Por ejemplo, en algunos momentos, el aumento en el volumen de noticias sobre violencia no necesariamente coincidió con un incremento proporcional en el número de víctimas reportadas, lo cual sugiere que otros factores, como la percepción pública o la cobertura mediática, están influyendo en la narrativa sobre la violencia. Este tipo de análisis puede ser útil para formuladores de políticas y organizaciones que trabajan en la prevención de la violencia, ya que permite identificar momentos críticos y posibles desencadenantes de conflicto.
Análisis de Comparación entre los Períodos de Duque y Petro
El análisis de los datos durante los períodos presidenciales de Duque y Petro muestra diferencias significativas en los indicadores de violencia. Los boxplots sugieren que las masacres han aumentado ligeramente durante el período de Petro en comparación con el de Duque, aunque este aumento no es estadísticamente significativo. Además, el volumen de noticias sobre violencia también ha aumentado, mientras que el tono promedio ha disminuido, lo que indica un enfoque más negativo en la cobertura mediática. El índice agregado sugiere que la violencia en general ha aumentado durante el período de Petro, lo cual refleja una preocupación creciente tanto en los datos objetivos como en la percepción mediática de la violencia.
Conclusión:
Tanto lo datos de LLM (digamos que AIdeosincráticos) así como los grandes datos de análisis de cobertura mediática nos ofrecen un panorama interesante para cazar, como en río revuelto, una perspectiva sobre la interacción del circo mediático y la realidad. Interesante la interacción de datos de origen digital tanto con encuestas como con bases de datos consolidadas en terreno.
Post a Comment