Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning

La congestión vial constituye uno de los principales desafíos para la movilidad urbana en Madrid, con repercusiones en la sostenibilidad, la calidad de vida y la planificación del transporte. Este Trabajo de Fin de Máster aborda el problema mediante la integración de datos multifuente —intensidad de...

Descripción completa

Detalles Bibliográficos
Autor: Calci Umpiri, Joselin Indira
Tipo de recurso: tesis de maestría
Fecha de publicación:2025
País:España
Institución:Universidad Complutense de Madrid (UCM)
Repositorio:Docta Complutense
Idioma:español
OAI Identifier:oai:docta.ucm.es:20.500.14352/124596
Acceso en línea:https://hdl.handle.net/20.500.14352/124596
Access Level:acceso abierto
Palabra clave:004.85
004.8
311
004.6
711.4
519.237
519.2
Tráfico urbano
Predicción
Datos multifuente
Machine Learning
Madrid
Urban traffic
Prediction
Multi-source data
Inteligencia artificial (Informática)
Estadística
Análisis Multivariante
1209 Estadística
1203.04 Inteligencia Artificial
1209.03 Análisis de Datos
3327.02 Análisis del Tráfico
1209.09 Análisis Multivariante
id ES_f45ceea8fc2d1978352e56696dca47c9
oai_identifier_str oai:docta.ucm.es:20.500.14352/124596
network_acronym_str ES
network_name_str España
repository_id_str
spelling Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learningCalci Umpiri, Joselin Indira004.85004.8311004.6711.4519.237519.2Tráfico urbanoPredicciónDatos multifuenteMachine LearningMadridUrban trafficPredictionMulti-source dataInteligencia artificial (Informática)EstadísticaAnálisis Multivariante1209 Estadística1203.04 Inteligencia Artificial1209.03 Análisis de Datos3327.02 Análisis del Tráfico1209.09 Análisis MultivarianteLa congestión vial constituye uno de los principales desafíos para la movilidad urbana en Madrid, con repercusiones en la sostenibilidad, la calidad de vida y la planificación del transporte. Este Trabajo de Fin de Máster aborda el problema mediante la integración de datos multifuente —intensidad de tráfico, meteorología y calendario de eventos— y el uso de algoritmos avanzados de aprendizaje automático, con el fin de predecir de manera temprana episodios de congestión. La metodología sigue el marco CRISP-DM, incluyendo comprensión de datos, preparación, modelado, evaluación y despliegue. Se definió como variable dependiente la congestión binaria (carga_bin_60), que indica la existencia o no de saturación de tráfico. Se entrenaron y evaluaron múltiples modelos, entre ellos regresión logística, árboles de decisión, Random Forest, Gradient Boosting, XGBoost, CatBoost y redes neuronales multicapa, empleando validación temporal con TimeSeriesSplit y métricas como ROC-AUC, PR-AUC, F1 y Balanced Accuracy. Los resultados muestran un rendimiento muy competitivo, con valores de ROC-AUC en torno a 0.98 y PR-AUC entre 0.91 y 0.93 en los mejores algoritmos. Destaca especialmente CatBoost, que alcanzó un ROC-AUC de 0.979, un PR-AUC de 0.926 y una Accuracy del 93,8 %. La regresión logística, aunque con métricas más modestas, se mantiene como un referente interpretable y de utilidad práctica. Estos hallazgos confirman la viabilidad de anticipar la congestión hasta tres horas por delante (T+3) con elevada precisión.Martín García, DanielUniversidad Complutense de Madrid20252025-09-0120252025-09-01master thesishttp://purl.org/coar/resource_type/c_bdccAOhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/20.500.14352/124596reponame:Docta Complutenseinstname:Universidad Complutense de Madrid (UCM)Españolspaopen accesshttp://purl.org/coar/access_right/c_abf2Attribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessoai:docta.ucm.es:20.500.14352/1245962026-06-02T12:44:21Z
dc.title.none.fl_str_mv Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
title Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
spellingShingle Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
Calci Umpiri, Joselin Indira
004.85
004.8
311
004.6
711.4
519.237
519.2
Tráfico urbano
Predicción
Datos multifuente
Machine Learning
Madrid
Urban traffic
Prediction
Multi-source data
Inteligencia artificial (Informática)
Estadística
Análisis Multivariante
1209 Estadística
1203.04 Inteligencia Artificial
1209.03 Análisis de Datos
3327.02 Análisis del Tráfico
1209.09 Análisis Multivariante
title_short Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
title_full Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
title_fullStr Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
title_full_unstemmed Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
title_sort Modelado predictivo del tráfico urbano en Madrid mediante integración de datos multifuente y algoritmos avanzados de machine learning
dc.creator.none.fl_str_mv Calci Umpiri, Joselin Indira
author Calci Umpiri, Joselin Indira
author_facet Calci Umpiri, Joselin Indira
author_role author
dc.contributor.none.fl_str_mv Martín García, Daniel
Universidad Complutense de Madrid
dc.subject.none.fl_str_mv 004.85
004.8
311
004.6
711.4
519.237
519.2
Tráfico urbano
Predicción
Datos multifuente
Machine Learning
Madrid
Urban traffic
Prediction
Multi-source data
Inteligencia artificial (Informática)
Estadística
Análisis Multivariante
1209 Estadística
1203.04 Inteligencia Artificial
1209.03 Análisis de Datos
3327.02 Análisis del Tráfico
1209.09 Análisis Multivariante
topic 004.85
004.8
311
004.6
711.4
519.237
519.2
Tráfico urbano
Predicción
Datos multifuente
Machine Learning
Madrid
Urban traffic
Prediction
Multi-source data
Inteligencia artificial (Informática)
Estadística
Análisis Multivariante
1209 Estadística
1203.04 Inteligencia Artificial
1209.03 Análisis de Datos
3327.02 Análisis del Tráfico
1209.09 Análisis Multivariante
description La congestión vial constituye uno de los principales desafíos para la movilidad urbana en Madrid, con repercusiones en la sostenibilidad, la calidad de vida y la planificación del transporte. Este Trabajo de Fin de Máster aborda el problema mediante la integración de datos multifuente —intensidad de tráfico, meteorología y calendario de eventos— y el uso de algoritmos avanzados de aprendizaje automático, con el fin de predecir de manera temprana episodios de congestión. La metodología sigue el marco CRISP-DM, incluyendo comprensión de datos, preparación, modelado, evaluación y despliegue. Se definió como variable dependiente la congestión binaria (carga_bin_60), que indica la existencia o no de saturación de tráfico. Se entrenaron y evaluaron múltiples modelos, entre ellos regresión logística, árboles de decisión, Random Forest, Gradient Boosting, XGBoost, CatBoost y redes neuronales multicapa, empleando validación temporal con TimeSeriesSplit y métricas como ROC-AUC, PR-AUC, F1 y Balanced Accuracy. Los resultados muestran un rendimiento muy competitivo, con valores de ROC-AUC en torno a 0.98 y PR-AUC entre 0.91 y 0.93 en los mejores algoritmos. Destaca especialmente CatBoost, que alcanzó un ROC-AUC de 0.979, un PR-AUC de 0.926 y una Accuracy del 93,8 %. La regresión logística, aunque con métricas más modestas, se mantiene como un referente interpretable y de utilidad práctica. Estos hallazgos confirman la viabilidad de anticipar la congestión hasta tres horas por delante (T+3) con elevada precisión.
publishDate 2025
dc.date.none.fl_str_mv 2025
2025-09-01
2025
2025-09-01
dc.type.none.fl_str_mv master thesis
http://purl.org/coar/resource_type/c_bdcc
AO
http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.openaire.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.none.fl_str_mv https://hdl.handle.net/20.500.14352/124596
url https://hdl.handle.net/20.500.14352/124596
dc.language.none.fl_str_mv Español
spa
language_invalid_str_mv Español
language spa
dc.rights.none.fl_str_mv open access
http://purl.org/coar/access_right/c_abf2
Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.openaire.fl_str_mv info:eu-repo/semantics/openAccess
rights_invalid_str_mv open access
http://purl.org/coar/access_right/c_abf2
Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Docta Complutense
instname:Universidad Complutense de Madrid (UCM)
instname_str Universidad Complutense de Madrid (UCM)
reponame_str Docta Complutense
collection Docta Complutense
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1869424465274732544
score 15,81155