Aplicación y comparación de modelos de machine learning destinados a la puntuación del riesgo de crédito

Alonso Pallarés, Álvaro

Aplicación y comparación de modelos de machine learning destinados a la puntuación del riesgo de crédito

En este trabajo de investigación se estudian y comparan modelos que se emplean actualmente en el ámbito del scoring, como son la regresión logística, junto con otros modelos de machine learning que también se podrían implementar como son las redes neuronales, el Support Vector Machine (SVM) y técnic...

Descripción completa

Detalles Bibliográficos
Autor:	Alonso Pallarés, Álvaro
Tipo de recurso:	tesis de maestría
Fecha de publicación:	2019
País:	España
Institución:	Universidad Complutense de Madrid (UCM)
Repositorio:	Docta Complutense
Idioma:	español
OAI Identifier:	oai:docta.ucm.es:20.500.14352/14326
Acceso en línea:	https://hdl.handle.net/20.500.14352/14326
Access Level:	acceso abierto
Palabra clave:	004.85 519.22-7 336.77 Machine learning riesgo crédito Informática (Informática) Estadística Investigación Comercial Economía Econometría (Economía) Mercados bursátiles y financieros 1203.17 Informática 1209 Estadística 53 Ciencias Económicas 5302 Econometría

Descripción
Sumario:	En este trabajo de investigación se estudian y comparan modelos que se emplean actualmente en el ámbito del scoring, como son la regresión logística, junto con otros modelos de machine learning que también se podrían implementar como son las redes neuronales, el Support Vector Machine (SVM) y técnicas basadas en árboles como son Bagging, Random Forest y Gradient Boosting. Otros estudios ya han demostrado la superioridad en técnicas de clasificación de las redes neuronales frente a la regresión logística. En esta investigación queremos comprobar si logramos unos resultados acordes a estas otras investigaciones, sobre todo fijándonos en dos objetivos en particular. En primer lugar, encontrar el modelo que mejor resultados obtenga en función de su capacidad predictiva, y en segundo lugar, lograr encontrar, si existe, una diferencia significativa tanto en términos de predicción como en tiempos de ejecución a la hora de utilizar las habituales variables categóricas binarias frente a sus homólogas tipo WOE. Los resultados demuestran que el modelo que mejores resultados obtiene es el SVM; y que las diferencias en calidad de predicción no son tan relevantes entre variables binarias y de tipo WOE, mientras que el tiempo de ahorro en ejecución por parte de este segundo tipo de variables es del todo significativo

Aplicación y comparación de modelos de machine learning destinados a la puntuación del riesgo de crédito

Similares en LA Referencia