Este trabajo propone la construcción de un indicador simple para hacer pronósticos de muy corto plazo (lo que se conoce también como nowcasting) de la inflación mensual en Colombia. Combina dos innovaciones relevantes: datos de Google Trends (GT), que capturan en tiempo real las búsquedas relacionadas con inflación, y Random Forest (RF), un método de aprendizaje automático que recientemente ha tenido gran acogida en la estimación de pronósticos económicos. La metodología empleada es sencilla, fácilmente actualizable y potencialmente aplicable a otros países, integrando información alternativa con variables macroeconómicas tradicionales para anticipar la inflación con mayor oportunidad.
El trabajo aporta una nueva herramienta para el monitoreo oportuno de la inflación en Colombia, siendo el primer estudio que integra Google Trends con Random Forest para este propósito en el país. La incorporación de datos de búsquedas digitales complementa los indicadores económicos tradicionales, intentando estimar con relativa precisión el dato de inflación con alrededor de un mes de anticipación. Esta combinación innovadora abre vías para el uso de nuevas fuentes y técnicas para la construcción de pronósticos que soporten el análisis para la conducción de la política económica.
Los resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado.
El indicador propuesto (RF-GT) supera en precisión a métodos de series de tiempo tradicionales (SARIMA), y otras técnicas alternativas de regresión (Lasso y Ridge) en pronósticos de inflación con un mes de anticipación. En comparación con la mediana de los pronósticos de los analistas financieros encuestados por el Banco de la República, el RF-GT muestra un error levemente mayor, pero sin diferencias estadísticamente significativas. Estos resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado. El análisis de importancia de variables indica que los factores más relevantes para el modelo son los rezagos de inflación y la frecuencia de búsqueda del término “precios” en Google, por encima de indicadores macroeconómicos tradicionales como la oferta monetaria o la tasa interbancaria.