Enhancing inflation nowcasting with online search data: a random forest application for Colombia

dc.audienceResearcherseng
dc.coverage.sucursalBogotáspa
dc.creatorRoldán-Ferrín, Felipe
dc.creatorParra-Polanía, Julián Andrés
dc.creator.firmaFelipe Roldán-Ferrínspa
dc.creator.firmaJulián A. Parra-Polaniaspa
dc.date.accessioned2025-07-01T17:13:08Zspa
dc.date.available2025-07-01T17:13:08Zspa
dc.date.created2025-07-02spa
dc.descriptionEste artículo evalúa la capacidad predictiva de un modelo de aprendizaje automático basado en Random Forest (RF), combinado con datos de Google Trends (GT), para realizar nowcasting de la inflación mensual en Colombia. El modelo propuesto, denominado RF-GT, se entrena utilizando datos históricos de inflación, indicadores macroeconómicos y actividad de búsqueda en internet. Tras la optimización de los hiperparámetros mediante validación cruzada para series de tiempo, se evalúa su desempeño fuera de muestra durante el periodo 2023–2024. Los resultados se comparan con enfoques tradicionales, incluidos los modelos SARIMA, regresiones Ridge y Lasso, así como con los pronósticos profesionales de la Encuesta Mensual de Expectativas (EME) del Banco de la República. En términos de precisión predictiva, el modelo RF-GT supera de forma consistente a los modelos estadísticos y muestra un desempeño comparable al pronóstico mediano de los analistas, con la ventaja adicional de generar predicciones aproximadamente semana y media antes. Estos hallazgos destacan el valor práctico de integrar fuentes de datos alternativas y técnicas de aprendizaje automático en los sistemas de monitoreo de inflación de economías emergentes.spa
dc.description.abstractThis paper evaluates the predictive capacity of a machine learning model based on Random Forests (RF), combined with Google Trends (GT) data, for nowcasting monthly inflation in Colombia. The proposed RF-GT model is trained using historical inflation data, macroeconomic indicators, and internet search activity. After optimizing the model’s hyperparameters through time series cross-validation, we assess its out-of-sample performance over the period 2023–2024. The results are benchmarked against traditional approaches, including SARIMA, Ridge, and Lasso regressions, as well as professional forecasts from the Banco de la República’s monthly survey of financial analysts (MES). In terms of forecast accuracy, the RF-GT model consistently outperforms the statistical models and performs comparably to the analysts’ median forecast, while offering the additional advantage of producing predictions approximately one and a half weeks earlier. These findings highlight the practical value of integrating alternative data sources and machine learning techniques into the inflation monitoring toolkit of emerging economies.eng
dc.description.notesEnfoque Este trabajo propone la construcción de un indicador simple para hacer pronósticos de muy corto plazo (lo que se conoce también como nowcasting) de la inflación mensual en Colombia. Combina dos innovaciones relevantes: datos de Google Trends (GT), que capturan en tiempo real las búsquedas relacionadas con inflación, y Random Forest (RF), un método de aprendizaje automático que recientemente ha tenido gran acogida en la estimación de pronósticos económicos. La metodología empleada es sencilla, fácilmente actualizable y potencialmente aplicable a otros países, integrando información alternativa con variables macroeconómicas tradicionales para anticipar la inflación con mayor oportunidad. Contribución El trabajo aporta una nueva herramienta para el monitoreo oportuno de la inflación en Colombia, siendo el primer estudio que integra Google Trends con Random Forest para este propósito en el país. La incorporación de datos de búsquedas digitales complementa los indicadores económicos tradicionales, intentando estimar con relativa precisión el dato de inflación con alrededor de un mes de anticipación. Esta combinación innovadora abre vías para el uso de nuevas fuentes y técnicas para la construcción de pronósticos que soporten el análisis para la conducción de la política económica. Resultados El indicador propuesto (RF-GT) supera en precisión a métodos de series de tiempo tradicionales (SARIMA), y otras técnicas alternativas de regresión (Lasso y Ridge) en pronósticos de inflación con un mes de anticipación. En comparación con la mediana de los pronósticos de los analistas financieros encuestados por el Banco de la República, el RF-GT muestra un error levemente mayor, pero sin diferencias estadísticamente significativas. Estos resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado. El análisis de importancia de variables indica que los factores más relevantes para el modelo son los rezagos de inflación y la frecuencia de búsqueda del término “precios” en Google, por encima de indicadores macroeconómicos tradicionales como la oferta monetaria o la tasa interbancaria. Frase destacada: Los resultados evidencian la utilidad de combinar técnicas de aprendizaje automático con fuentes alternativas de información para generar pronósticos oportunos y comparables con los del mercado. Frase en inglés: The results highlight the usefulness of combining machine learning techniques with alternative sources of information to generate timely forecasts that are comparable to those of the market.spa
dc.format.extent18 páginasspa
dc.format.mimetypePDFspa
dc.identifier.handlehttps://hdl.handle.net/20.500.12134/11241spa
dc.identifier.urihttps://repositorio.banrep.gov.co/handle/20.500.12134/11241spa
dc.language.isoengeng
dc.publisherBanco de la República spa
dc.relation.doihttps://doi.org/10.32468/be.1318spa
dc.relation.handlehttps://hdl.handle.net/20.500.12134/11241spa
dc.relation.infohttps://repositorio.banrep.gov.co/sitios/1318spa
dc.relation.inveshttps://investiga.banrep.gov.co/es/borradores/be-1318spa
dc.relation.ispartofDocumentos de Trabajospa
dc.relation.ispartofseriesBorradores de Economíaspa
dc.relation.isversionofBorradores de Economía; No.1318spa
dc.relation.numberBorrador 1318spa
dc.relation.portalhttps://www.banrep.gov.co/es/publicaciones-investigaciones/borradores-economia/mejorando-nowcasting-inflacion-datos-busquedasspa
dc.relation.repechttps://ideas.repec.org/p/bdr/borrec/1318.htmlspa
dc.relation.shortdoihttps://doi.org/pt3wspa
dc.rights.HabeasDatos personales: El(los) autor(es) ha(n) incluido sus datos personales (nombres, correo electrónico, filiación académica, perfil académico, entre otros) en el Portal de Investigaciones o la obra remitida para publicación, y por consiguiente, manifiesta(n) que mediante el diligenciamiento y registro de sus datos personales autoriza(n) al Banco de la República el tratamiento (recolección, almacenamiento, uso, circulación o supresión) de todos los datos suministrados con la finalidad de adelantar la publicación de la obra en el Portal de Investigaciones, dar a conocer su perfil académico y medios de contacto para fines académicos y divulgativos, así como para la construcción de indicadores y estadísticas para el seguimiento y control de las actividades de divulgación del Portal de Investigaciones. Para tal fin, se informa que el tratamiento de los datos personales se realizará de acuerdo con las políticas o lineamientos generales disponibles en http://www.banrep.gov.co/proteccion-datos-personales, en la sección “Protección de Datos Personales - Habeas Data”.spa
dc.rights.ObjetoObjeto de publicación: La obra de mí (nuestra) autoría tiene por objeto ser publicada en el Portal de Investigaciones del Banco de la República e incluirla en el repositorio institucional de esa misma entidad. La obra podrá consistir en documento escrito, audiovisual, audio, gráfico, fotográfico, infográfico, podcasts, etc., y podrá estar en cualquier formato conocido o por conocerse.spa
dc.rights.accessRightsOpen Accesseng
dc.rights.ccAtribucion-NoComercial-CompartirIgual CC BY-NC-SA 4.0eng
dc.rights.disclaimerLas opiniones contenidas en el presente documento son responsabilidad exclusiva de los autores y no comprometen al Banco de la República ni a su Junta Directiva.spa
dc.rights.disclaimerThe opinions contained in this document are the sole responsibility of the author and do not commit Banco de la República or its Board of Directors.eng
dc.rights.spaAcceso abiertospa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/eng
dc.source.handleRepecRePEc:bdr:borrec:1318spa
dc.subjectInflaciónspa
dc.subjectPronóstico en tiempo realspa
dc.subjectPronósticospa
dc.subjectBosques aleatoriosspa
dc.subjectTendencias de Googlespa
dc.subjectAprendizaje automáticospa
dc.subject.brtema5. Precios, inflación y política monetariaspa
dc.subject.jelC14 - Semiparametric and Nonparametric Methods: Generaleng
dc.subject.jelC53 - Forecasting and Prediction Methods; Simulation Methodseng
dc.subject.jelE17 - General Aggregative Models: Forecasting and Simulation: Models and Applicationeng
dc.subject.jelE31 - Price Level; Inflation; Deflationeng
dc.subject.jelE37 - Prices, Business Fluctuations, and Cycles: Forecasting and Simulation: Models and Applicationeng
dc.subject.jelspaC14 - Métodos semiparamétricos y no paramétricos: generalidadesspa
dc.subject.jelspaC53 - Métodos de pronóstico y predicción; métodos de simulaciónspa
dc.subject.jelspaE17 - Modelos agregados generales: Predicción y simulación; Modelos y aplicaciónspa
dc.subject.jelspaE31 - Nivel de precios; Inflación; Deflaciónspa
dc.subject.jelspaE37 - Precios, fluctuaciones y ciclos económicos: Predicción y simulación; Modelos y aplicaciónspa
dc.subject.keywordInflationeng
dc.subject.keywordNowcastingeng
dc.subject.keywordForecastingeng
dc.subject.keywordRandom Foresteng
dc.subject.keywordGoogle Trendseng
dc.subject.keywordMachine learningeng
dc.subject.lembInflación - Colombiaspa
dc.subject.lembEstudios económicos -- Metodos de simulación - - Colombiaspa
dc.titleEnhancing inflation nowcasting with online search data: a random forest application for Colombiaeng
dc.title.alternativeMejorando el nowcasting de la inflación con datos de búsquedas en línea: Una aplicación de random forest para Colombiaspa
dc.typeWorking Papereng
dc.type.hasversionPublished Versioneng
dc.type.spaDocumentos de trabajospa
local.caie.checklist11. Esta versión del documento ha sido presentada en algún seminario interno del Banco?: sispa
local.caie.checklist2Frente a los temas sensibles actualmente en país, considera que su documento es: NO SENSIBLEspa
local.caie.checklist61. ¿Este trabajo trata temas relacionados con el cambio climático?: nospa
local.caie.validadorSubgerencia de Estudios Economicos - Juan Esteban Carranza - jcarraro@banrep.gov.cospa

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
be_1318.pdf
Size:
1.64 MB
Format:
Adobe Portable Document Format
FILE
https://repositorio.banrep.gov.co/bitstream/handle/20.500.12134/11241/be_1318.pdf
Description:
Borradores de Economía; No.1318
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
5.3 KB
Format:
Item-specific license agreed upon to submission
Description: