Forecasting Disaggregated Food Inflation Baskets in Colombia with an XGBoost Model

dc.audiencePolicymakerseng
dc.audienceResearcherseng
dc.audienceTeacherseng
dc.audienceStudentseng
dc.coverage.sucursalCalispa
dc.creatorAnzola , César
dc.creatorPoveda-Olarte, Andrea Paola
dc.creator.firmaCésar Anzola Bravospa
dc.creator.firmaPaola Povedaspa
dc.date.accessioned2025-12-11T13:58:43Zspa
dc.date.available2025-12-11T13:58:43Zspa
dc.date.created2025-12-11spa
dc.descriptionLos precios de los alimentos han sido uno de los principales factores que contribuyen a la inflación en Colombia. Estos son particularmente sensibles a factores externos como choques climáticos, interrupciones en las cadenas globales de valor y choques en los precios de los productos básicos a nivel global, lo que resulta en fluctuaciones impredecibles de precios. Este documento tiene dos objetivos. En primer lugar, busca estimar y evaluar métodos para pronosticar 33 canastas homogéneas de inflación de alimentos, ofreciendo herramientas que puedan ayudar a los hacedores de política anticipar los factores que afectan la inflación de alimentos futura. Esto incluye tanto modelos tradicionales de series de tiempo como enfoques modernos de machine learning. En segundo lugar, se propone mejorar la interpretabilidad de las predicciones de los modelos mediante técnicas de explainableAI. Para ello, proponemos un algoritmo de selección de variables que identifique las variables explicativas más relevantes, y utilizamos valores SHAP (SHapley Additive exPlanations) para cuantificar la contribución de cada variable explicativa en las predicciones del modelo. Nuestros hallazgos indican que los modelos de machine learning superan a los enfoques tradicionales en el pronóstico de la inflación de alimentos, logrando una mayor precisión tanto en la mayoría de las canastas individuales como en la inflación de alimentos agregada.spa
dc.description.abstractFood prices have consistently been one of the leading contributors to Colombia’s inflation rate. They are particularly sensitive to exogenous factors such as extreme weather events, supply chain disruptions, and global commodity price shocks, often resulting in sharp and unpredictable price fluctuations. This document pursues two main objectives. First, it aims to estimate and evaluate methods for forecasting 33 homogeneous food inflation baskets, which together constitute the total food Consumer Price Index (Food CPI), offering tools that can assist policymakers in anticipating the drivers of future inflation. This includes both traditional time series models and modern machine learning approaches. Second, it seeks to enhance the interpretability of model predictions through explainable AI techniques. To achieve this, we propose a variable lag selection algorithm to identify optimal feature-lag pairs, and employ SHAP (SHapley Additive exPlanations) values to quantify the contribution of each feature to the model’s forecast. Our findings indicate that machine learning models outperform traditional approaches in forecasting food inflation, delivering improved accuracy across most individual baskets as well as for aggregated food inflation.eng
dc.description.notesEnfoque Este artículo tiene como objetivo desarrollar modelos estadísticos para pronosticar la inflación mensual de los próximos 12 meses para 33 canastas que conforman el Índice de Precios al Consumidor (IPC) de alimentos. Para ello, se emplean tanto modelos tradicionales de series de tiempo como enfoques basados en Machine Learning. Cada canasta se modela de manera independiente, incorporando 4 grupos de variables explicativas relevantes para la oferta de alimentos: variables climáticas, la tasa de cambio nominal, precios de materias primas, y costos de transporte y energía. Los precios de las materias primas y la energía influyen en la inflación de alimentos al afectar los costos de producción, transporte y procesamiento. Además, el clima impacta la producción agrícola al alterar el crecimiento de cultivos, la calidad del suelo y la salud del ganado. Por otro lado, el documento busca interpretar los pronósticos mediante el uso de valores SHAP (SHapley Additive exPlanations), una herramienta ampliamente utilizada para explicar las predicciones de modelos de machine learning. Contribución Esta investigación contribuye a la literatura de pronósticos de inflación de alimentos al probar que los modelos basados en arboles de decisión tipo XGBoost realizan pronósticos más acertados que modelos de series de tiempo lineales. Por otro lado, mostramos que es posible descomponer las predicciones de este modelo en contribuciones de variables explicativas fundamentales. Las dinámicas de cada canasta de alimentos responden a variables como el clima, precios de materias primas, costos de transporte y el comportamiento de la tasa de cambio. La interpretación de las predicciones de estos modelos es lograda gracias a un proceso exhaustivo de selección de las variables explicativas y a un algoritmo que proponemos para seleccionar los rezagos óptimos de las variables explicativas. Este algoritmo permite reducir el número de variables, lo que simplifica la interpretación y reduce costos computacionales. Resultados Los modelos tipo XGBoost son más precisos pronosticando la inflación de alimentos que los modelos lineales para la mayoría de las 33 canastas estudiadas, especialmente para horizontes de pronóstico más lejanos. Los errores de pronóstico del modelo XGBoost fueron entre un 5% y un 60% menores que los de los modelos lineales, dependiendo de la canasta y del horizonte de pronóstico, y para la canasta agregada de inflación los errores fueron en promedio 25% menores. Existe un alto grado de heterogeneidad en cuanto a la explicación de los pronósticos dependiendo de la canasta a estudiar. Para ciertos grupos de alimentos, como los alimentos perecederos, el clima y la persistencia de la inflación son factores relevantes. En contraste, otros alimentos, como los industriales, son principalmente explicados por costos de materias primas y persistencia de la inflación. Frase destacada: Los modelos tipo XGBoost son más precisos pronosticando la inflación de alimentos que los modelos lineales para la mayoría de las 33 canastas estudiadas, especialmente para horizontes de pronóstico más lejanos.spa
dc.format.extent42 páginasspa
dc.format.mimetypePDFspa
dc.identifier.handlehttps://hdl.handle.net/20.500.12134/11316spa
dc.identifier.urihttps://repositorio.banrep.gov.co/handle/20.500.12134/11316spa
dc.language.isoengeng
dc.publisherBanco de la Repúblicaspa
dc.relation.doihttps://doi.org/10.32468/be.1335spa
dc.relation.handlehttps://hdl.handle.net/20.500.12134/11316spa
dc.relation.infohttps://repositorio.banrep.gov.co/sitios/1335spa
dc.relation.inveshttps://investiga.banrep.gov.co/es/borradores/be-1335spa
dc.relation.ispartofDocumentos de Trabajospa
dc.relation.ispartofseriesBorradores de Economíaspa
dc.relation.isversionofBorradores de Economía; No.1335spa
dc.relation.numberBorrador 1335spa
dc.relation.portalxxxspa
dc.relation.repechttps://ideas.repec.org/p/bdr/borrec/1335.htmlspa
dc.relation.shortdoihttps://doi.org/qhv2spa
dc.rights.HabeasDatos personales: El(los) autor(es) ha(n) incluido sus datos personales (nombres, correo electrónico, filiación académica, perfil académico, entre otros) en el Portal de Investigaciones o la obra remitida para publicación, y por consiguiente, manifiesta(n) que mediante el diligenciamiento y registro de sus datos personales autoriza(n) al Banco de la República el tratamiento (recolección, almacenamiento, uso, circulación o supresión) de todos los datos suministrados con la finalidad de adelantar la publicación de la obra en el Portal de Investigaciones, dar a conocer su perfil académico y medios de contacto para fines académicos y divulgativos, así como para la construcción de indicadores y estadísticas para el seguimiento y control de las actividades de divulgación del Portal de Investigaciones. Para tal fin, se informa que el tratamiento de los datos personales se realizará de acuerdo con las políticas o lineamientos generales disponibles en http://www.banrep.gov.co/proteccion-datos-personales, en la sección “Protección de Datos Personales - Habeas Data”.spa
dc.rights.ObjetoObjeto de publicación: La obra de mí (nuestra) autoría tiene por objeto ser publicada en el Portal de Investigaciones del Banco de la República e incluirla en el repositorio institucional de esa misma entidad. La obra podrá consistir en documento escrito, audiovisual, audio, gráfico, fotográfico, infográfico, podcasts, etc., y podrá estar en cualquier formato conocido o por conocerse.spa
dc.rights.accessRightsOpen Accesseng
dc.rights.ccAtribucion-NoComercial-CompartirIgual CC BY-NC-SA 4.0eng
dc.rights.disclaimerLas opiniones contenidas en el presente documento son responsabilidad exclusiva de los autores y no comprometen al Banco de la República ni a su Junta Directiva.spa
dc.rights.disclaimerThe opinions contained in this document are the sole responsibility of the author and do not commit Banco de la República or its Board of Directors.eng
dc.rights.spaAcceso abiertospa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/eng
dc.source.handleRepecRePEc:bdr:borrec:1335spa
dc.subjectPronóstico Macroeconómicospa
dc.subjectInflación de alimentosspa
dc.subjectMachine learningspa
dc.subject.brtema5. Precios, inflación y política monetariaspa
dc.subject.jelC53 - Forecasting and Prediction Methods; Simulation Methodseng
dc.subject.jelE31 - Price Level; Inflation; Deflationeng
dc.subject.jelE37 - Prices, Business Fluctuations, and Cycles: Forecasting and Simulation: Models and Applicationeng
dc.subject.jelspaC53 - Métodos de pronóstico y predicción; métodos de simulaciónspa
dc.subject.jelspaE31 - Nivel de precios; Inflación; Deflaciónspa
dc.subject.jelspaE37 - Precios, fluctuaciones y ciclos económicos: Predicción y simulación; Modelos y aplicaciónspa
dc.subject.keywordMacroeconomic Forecastseng
dc.subject.keywordFood Priceseng
dc.subject.keywordMachine learningeng
dc.subject.lembEconomía -- Inflación -- Pronosticosspa
dc.titleForecasting Disaggregated Food Inflation Baskets in Colombia with an XGBoost Model eng
dc.title.alternativePronosticando inflaciones de canastas de alimentos desagregadas en Colombia usando un modelo XGBoostspa
dc.typeWorking Papereng
dc.type.hasversionPublished Versioneng
dc.type.spaDocumentos de trabajospa
local.caie.checklist11. Esta versión del documento ha sido presentada en algún seminario interno del Banco?: sispa
local.caie.checklist2Frente a los temas sensibles actualmente en país, considera que su documento es: NO SENSIBLEspa
local.caie.checklist61. ¿Este trabajo trata temas relacionados con el cambio climático?: nospa
local.caie.checklistriec1. ¿Desea cargar este borrador al repositorio de la Red Investigadores de Economía?: sispa
local.caie.validadorSucursal Cali y Sucursal Bucaramanga- Margarita Gáfaro González - mgafargo@banrep.gov.cospa
local.grupos.tematicosriec2. Economía e Inteligencia Artificialspa

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
be_1335.pdf
Size:
1.76 MB
Format:
Adobe Portable Document Format
FILE
https://repositorio.banrep.gov.co/bitstream/handle/20.500.12134/11316/be_1335.pdf
Description:
Borradores de Economía; No.1335
License bundle
Now showing 1 - 1 of 1
Name:
license.txt
Size:
5.3 KB
Format:
Item-specific license agreed upon to submission
Description: