Aplicación y comparación de modelos de machine learning destinados a la puntuación del riesgo de crédito
En este trabajo de investigación se estudian y comparan modelos que se emplean actualmente en el ámbito del scoring, como son la regresión logística, junto con otros modelos de machine learning que también se podrían implementar como son las redes neuronales, el Support Vector Machine (SVM) y técnic...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2019 |
| País: | España |
| Institución: | Universidad Complutense de Madrid (UCM) |
| Repositorio: | Docta Complutense |
| Idioma: | español |
| OAI Identifier: | oai:docta.ucm.es:20.500.14352/14326 |
| Acceso en línea: | https://hdl.handle.net/20.500.14352/14326 |
| Access Level: | acceso abierto |
| Palabra clave: | 004.85 519.22-7 336.77 Machine learning riesgo crédito Informática (Informática) Estadística Investigación Comercial Economía Econometría (Economía) Mercados bursátiles y financieros 1203.17 Informática 1209 Estadística 53 Ciencias Económicas 5302 Econometría |
| Sumario: | En este trabajo de investigación se estudian y comparan modelos que se emplean actualmente en el ámbito del scoring, como son la regresión logística, junto con otros modelos de machine learning que también se podrían implementar como son las redes neuronales, el Support Vector Machine (SVM) y técnicas basadas en árboles como son Bagging, Random Forest y Gradient Boosting. Otros estudios ya han demostrado la superioridad en técnicas de clasificación de las redes neuronales frente a la regresión logística. En esta investigación queremos comprobar si logramos unos resultados acordes a estas otras investigaciones, sobre todo fijándonos en dos objetivos en particular. En primer lugar, encontrar el modelo que mejor resultados obtenga en función de su capacidad predictiva, y en segundo lugar, lograr encontrar, si existe, una diferencia significativa tanto en términos de predicción como en tiempos de ejecución a la hora de utilizar las habituales variables categóricas binarias frente a sus homólogas tipo WOE. Los resultados demuestran que el modelo que mejores resultados obtiene es el SVM; y que las diferencias en calidad de predicción no son tan relevantes entre variables binarias y de tipo WOE, mientras que el tiempo de ahorro en ejecución por parte de este segundo tipo de variables es del todo significativo |
|---|