Observatorio electoral
METODOLOGÍA
Nowcast y Proyección de la Elección Presidencial Colombia 2026
Un Ensemble de Tres Modelos: Bayesiano · Filtro de Kalman · Gravedad-Taylor
Marzo 13, 2026 · Dashboard actualizado al 12 de marzo
1. Motivación: Por Qué las Encuestas No Son Suficientes
En los últimos dos ciclos electorales colombianos, las encuestas de intención de voto fallaron de manera sistemática al estimar el resultado final de candidatos específicos. El patrón no es ruido aleatorio — es sesgo estructural.
* Consulta del Gran Pacto de Derechas, 8 de marzo de 2026.
Tres patrones emergen de este análisis:
Los candidatos de centro o de derecha-establecimiento son sistemáticamente subestimados en encuestas telefónicas.
Candidatos con alta viralidad digital (Hernández 2022, Valencia 2026) acumulan momentum en Google Trends y mercados de predicción antes de que las encuestas lo reflejen.
El error crece cuanto más cercano está el candidato al arquetipo de "caballo oscuro" — outsider con baja base de sondeo pero alta energía de campaña.
La respuesta metodológica es no tratar las encuestas como el ancla estructural del modelo, sino como una de varias señales con un peso que decae con el tiempo. Las señales digitales — que se actualizan continuamente — asumen el liderazgo del estado del sistema.
2. Arquitectura de Señales de Entrada
2.1 Polymarket — La Señal Primaria
Se utiliza el mercado de ganador total de la presidencia en Polymarket ($8,017,157 en volumen al 12 de marzo de 2026). Este contrato premia a quien pronostique correctamente al ganador final, incluyendo segunda vuelta, lo que lo convierte en una estimación de probabilidad condicional a largo plazo con incentivos financieros reales.
El nivel de Polymarket se interpola entre los 9 puntos de datos disponibles (24 de enero al 12 de marzo) y se normaliza para que los 4 candidatos sumen 100%.
2.2 Google Trends Calibrado — La Señal de Momentum
Google Trends mide volumen de búsqueda relativo, no intención de voto. La conversión de una métrica a la otra requiere calibración empírica. Se construyó una tabla de ratios de corrección utilizando los resultados de 2018 y 2022:
La calibración implica que el empate bruto en Google Trends de marzo 2026 (Cepeda 21, Valencia 21) es engañoso: después de aplicar los ratios, Valencia alcanza ~32% y Cepeda ~23% entre los cuatro candidatos. Esto es consistente con la señal de Polymarket pero muy superior a las encuestas pre-8 de marzo.
2.3 La Señal Digital Compuesta
Polymarket y GT calibrado se combinan en una sola señal digital normalizada:
Esta señal digital es el corazón del sistema. Encuestas, Kalman y gravedad la modifican — no la reemplazan.
2.4 Encuestas — El Ancla con Decaimiento Temporal
Se incorporan 7 encuestas de 6 firmas distintas, todas de campo entre enero y marzo de 2026. Cada firma recibe un peso empírico derivado de su MAE histórico en elecciones anteriores y el desempeño en la Gran Consulta del 8 de marzo:
La fórmula R = 25/w² conecta el peso bayesiano con el ruido de observación en el Filtro de Kalman: una firma con w=0.82 (GAD3) mueve el estado latente más que una con w=0.62 (CNC), exactamente como hacen los pesos en el promedio ponderado.
3. Los Tres Sub-Modelos
Sub-modelo A: Bayesiano con Decaimiento Exponencial
Principio
El modelo bayesiano trata la señal digital como el prior (la estimación de base) y las encuestas como una verosimilitud que se aplica con peso λ, donde λ decrece exponencialmente con el tiempo transcurrido desde la última encuesta publicada.
La encuesta_ancla es el promedio ponderado de todas las encuestas publicadas hasta el momento t. A 12 de marzo (11 días después de la última encuesta de campo), las señales digitales dominan con ~65% del peso.
La Corrección de Caballo Oscuro (DH)
Una capa adicional aplica la corrección histórica de patrón dark horse — el sesgo sistemático documentado en 2018, 2022 y la Gran Consulta de 2026:
El ajuste no se aplica como corrección determinista sino probabilística: el estado corregido se mezcla con el estado base según DH_BLEND × confianza, y el resultado se reescala para preservar la suma total de votos.
Sub-modelo B: Filtro de Kalman Digital
Principio
El Filtro de Kalman es el más formalmente riguroso de los tres. Modela el estado latente (la intención real de voto, inobservable) como una variable que evoluciona en el tiempo con ruido de proceso Q, y lo actualiza recursivamente cada vez que llega una nueva observación de cualquier fuente.
La innovación clave respecto a un Kalman estándar es triple:
Inicialización: el estado inicial se fija en la señal digital (no en el promedio de encuestas), reduciendo la anchura de la banda de incertidumbre temprana para los candidatos mejor captados por los mercados.
Tres flujos de observación: GT calibrado, Polymarket, y encuestas se procesan como observaciones secuenciales con sus respectivos niveles de ruido R.
P₀ asimétrico: la varianza inicial es mayor para Valencia (P₀=120) que para Cepeda (P₀=30), reflejando la incertidumbre pre-consulta diferencial entre candidatos.
Banda de Incertidumbre del 95%
La varianza residual P(t|t) permite construir intervalos de confianza formales: el estado se presenta con una banda IC95% = x ± 1.96√P. En la fase de proyección, P crece linealmente con Q por cada paso hacia adelante, ampliando la banda — lo que refleja fielmente que la incertidumbre aumenta con el horizonte temporal.
Sub-modelo C: Gravedad-Taylor
Principio
El modelo de gravedad toma prestado el lenguaje de la mecánica newtoniana para describir el momentum de los candidatos en los mercados de predicción. Se ajusta un polinomio de grado 3 sobre los 9 puntos de Polymarket disponibles (24 de enero al 12 de marzo), y se extraen la primera y segunda derivadas en el punto terminal como velocidad y aceleración.
Los datos actuales (Mar 12) revelan asimetría extrema de momentum:
El ratio KE Valencia/Cepeda es ~1,500×. La caída de Cepeda del 11 al 12 de marzo (−4pp en un día) no es una señal de campo sino repricing condicional: el mercado ajusta P(Cepeda gana en total) = P(pasa R1) × P(gana R2 vs Valencia), y al subir Valencia, baja el segundo factor.
Las proyecciones del modelo de gravedad están acotadas por los bounds históricos para evitar extrapolaciones físicamente absurdas (e.g., Valencia no puede superar 50% de primera vuelta dado el techo histórico documentado).
4. El Ensemble: Combinación Dinámica de los Tres Modelos
El estimado final no es el promedio simple de los tres sub-modelos. Los pesos varían según la fase temporal:
La lógica del cambio de pesos:
En la fase histórica, los tres modelos tienen datos similares y se equilibran. El Kalman recibe un peso ligeramente menor que Bayes porque no aplica la corrección DH.
En la proyección, el modelo de gravedad toma el protagonismo: es el que mejor captura el momentum actual de mercado y no necesita anclas de encuesta. Kalman pierde peso porque su banda de incertidumbre crece rápidamente hacia adelante.
4.1 La Banda de Incertidumbre del Ensemble
Además del estimado puntual, se calcula la dispersión entre los tres sub-modelos como medida de incertidumbre epistémica:
Esta banda es especialmente informativa: donde Bayes y Kalman divergen señala que la señal digital no se ha confirmado aún en encuestas de campo. Donde el modelo de gravedad diverge de los otros dos señala que el momentum de mercado está descontando un escenario que los indicadores de campo aún no ven.
5. Pisos y Techos Históricos
Ninguna proyección puede ignorar lo que sabemos de la geometría electoral colombiana. Cada candidato tiene un rango de posibilidades delimitado por la historia:
Estos bounds se aplican como clamping duro en los tres sub-modelos y en el ensemble final. El techo de Cepeda en 42% es especialmente relevante: el récord absoluto de la izquierda colombiana en primera vuelta es 40.3% (Petro 2022), y superar ese umbral requeriría condiciones extraordinarias no presentes en 2026.
6. Limitaciones y Lo Que el Modelo No Puede Hacer
7. Qué Haría Actualizar el Modelo Significativamente
El modelo tiene alta sensibilidad a tres tipos de eventos futuros:
Alta Prioridad
Primera encuesta post-Gran Consulta (esperada primera semana de abril, GAD3 o AtlasIntel): este dato moverá el Filtro de Kalman con el gain más alto del ciclo (K_GAD3 ≈ 0.5 dado el P acumulado). Si Valencia aparece en 20%+ en campo, el modelo convergería con Polymarket. Si aparece en 12-14%, la corrección DH bajaría a ~0.50.
Continuación de la trayectoria de Polymarket: si Valencia cruza 45% en el mercado de ganador total, el modelo de gravedad proyectaría un primer lugar técnico antes de la primera vuelta.
Prioridad Media
Inscripción y fórmula de Fajardo (esperada esta semana): si Edna Bonilla confirma como VP, el modelo de caballo oscuro para el centro se activaría con mayor confianza.
Debates presidenciales (calendarizados para abril-mayo): la señal GT es un buen indicador del impacto de debates — un pico sostenido de 5+ días post-debate sería señal confiable.
Prioridad Baja
Datos mensuales de Google Trends para abril 2026 (llegan con ~7 días de rezago después del cierre del mes).
Cambios en mercados menores (Metaculus, Manifold): servirían para triangular la señal de Polymarket en escenarios de alta incertidumbre.
8. Estado Actual del Modelo (Mar 12, 2026)
La divergencia más informativa es Valencia: el ensemble (~28.6%) es 22 puntos porcentuales mayor que el promedio de campo (6.6%). Esta brecha es enteramente consecuencia de la señal digital post-Gran Consulta y la corrección DH. Es el análogo exacto de Hernández 2022: campo 19%, resultado real 28.2%.
Datos utilizados: Polymarket ($8M vol, ganador total); Google Trends Colombia (CSV sep 2025–mar 2026); 7 encuestas de campo (Guarumo×2, AtlasIntel, Invamer, Celag, CNC, GAD3) con datos de campo ene–feb 2026; resultados electorales Registraduría Nacional 2002–2022; resultados Gran Consulta 8 de marzo de 2026.
Código fuente: Dashboard interactivo en React/Recharts. Los tres sub-modelos se implementan como funciones puras en JavaScript sin dependencias externas de ML. El ensemble se recalcula en tiempo real al cambiar los parámetros del modelo.
Nota: Este análisis es exclusivamente de carácter metodológico y académico. No constituye asesoramiento político ni pronóstico oficial.
Post a Comment