Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
El conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2020 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/107266 |
| Acceso en línea: | http://hdl.handle.net/10609/107266 |
| Access Level: | acceso abierto |
| Palabra clave: | NHANES machine learning clustering aprenentatge automàtic aprendizaje automático Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM |
| id |
ES_b41bce67faebcc769eb850e02400d707 |
|---|---|
| oai_identifier_str |
oai:openaccess.uoc.edu:10609/107266 |
| network_acronym_str |
ES |
| network_name_str |
España |
| repository_id_str |
|
| spelling |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisadoSánchez Temporal, RaúlNHANESmachine learningclusteringNHANESaprenentatge automàticclusteringNHANESaprendizaje automáticoclusteringMachine learning -- TFMAprenentatge automàtic -- TFMAprendizaje automático -- TFMEl conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo se propone el uso de técnicas de aprendizaje no supervisado aplicado sobre los datos NHANES con el objetivo de detectar patrones que permitan perfilar a los pacientes en base a sus similitudes encontrando grupos (clústeres) naturales para estos. En concreto el trabajo se centra en el uso de métodos de agrupamiento basados en densidad y métodos jerárquicos. A su vez se crea una interfaz web que permite la clasificación de los pacientes en los diferentes clústeres que se generen. Para el desarrollo del trabajo se sigue la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) ampliamente adoptada para proyectos de minería de datos que proporciona la descripción del ciclo de vida donde se definen las tareas necesarias para cada fase.El conjunt de dades National Health and Nutrition Examination Survey (NHANES) facilitat pel Centre de Control de malalties i Prevenció (CDC) suposa una oportunitat única per a dur a terme recerques i anàlisis que puguin ajudar en la millora de la salut de les persones. En aquest treball es proposa l'ús de tècniques d'aprenentatge no supervisat aplicat sobre les dades NHANES amb l'objectiu de detectar patrons que permetin perfilar als pacients sobre la base de les seves similituds trobant grups (clústers) naturals per a aquests. En concret el treball se centra en l'ús de mètodes d'agrupament basats en densitat i mètodes jeràrquics. Al seu torn es crea una interfície web que permet la classificació dels pacients en els diferents clústers que es generin. Per al desenvolupament del treball se segueix la metodologia Cross Industry Standard Process for Data Mining (CRISP-DM) àmpliament adoptada per a projectes de mineria de dades que proporciona la descripció del cicle de vida on es defineixen les tasques necessàries per a cada fase.The National Survey of Health and Nutrition Survey (NHANES) data set provided by the Center for Disease Control and Prevention (CDC) is a unique opportunity to conduct research and analysis that can help improve the health of people. This paper proposes the use of unsupervised learning techniques applied to NHANES data in order to detect patterns that adapt to patients based on their similarities by finding natural groups (clusters) for them. Specifically, the work focuses on the use of methods of grouping methods in density and hierarchical methods. In addition, a web interface is created that allows the classification of patients in the different clusters that are generated. For the development of the work, the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology is followed, which is widely adopted for data mining projects that describe the life cycle where the necessary tasks are defined for each phase.Universitat Oberta de Catalunya (UOC)Prados Carrasco, FerranSubirats, Laia202020202020info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/107266reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)EspañolCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1072662026-05-28T12:42:01Z |
| dc.title.none.fl_str_mv |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| title |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| spellingShingle |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado Sánchez Temporal, Raúl NHANES machine learning clustering NHANES aprenentatge automàtic clustering NHANES aprendizaje automático clustering Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM |
| title_short |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| title_full |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| title_fullStr |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| title_full_unstemmed |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| title_sort |
Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado |
| dc.creator.none.fl_str_mv |
Sánchez Temporal, Raúl |
| author |
Sánchez Temporal, Raúl |
| author_facet |
Sánchez Temporal, Raúl |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Prados Carrasco, Ferran Subirats, Laia |
| dc.subject.none.fl_str_mv |
NHANES machine learning clustering NHANES aprenentatge automàtic clustering NHANES aprendizaje automático clustering Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM |
| topic |
NHANES machine learning clustering NHANES aprenentatge automàtic clustering NHANES aprendizaje automático clustering Machine learning -- TFM Aprenentatge automàtic -- TFM Aprendizaje automático -- TFM |
| description |
El conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo se propone el uso de técnicas de aprendizaje no supervisado aplicado sobre los datos NHANES con el objetivo de detectar patrones que permitan perfilar a los pacientes en base a sus similitudes encontrando grupos (clústeres) naturales para estos. En concreto el trabajo se centra en el uso de métodos de agrupamiento basados en densidad y métodos jerárquicos. A su vez se crea una interfaz web que permite la clasificación de los pacientes en los diferentes clústeres que se generen. Para el desarrollo del trabajo se sigue la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) ampliamente adoptada para proyectos de minería de datos que proporciona la descripción del ciclo de vida donde se definen las tareas necesarias para cada fase. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020 2020 2020 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/10609/107266 |
| url |
http://hdl.handle.net/10609/107266 |
| dc.language.none.fl_str_mv |
Español |
| language_invalid_str_mv |
Español |
| dc.rights.none.fl_str_mv |
CC BY-NC-ND http://creativecommons.org/licenses/by-nc-nd/3.0/es/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
CC BY-NC-ND http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf application/pdf application/pdf |
| dc.publisher.none.fl_str_mv |
Universitat Oberta de Catalunya (UOC) |
| publisher.none.fl_str_mv |
Universitat Oberta de Catalunya (UOC) |
| dc.source.none.fl_str_mv |
reponame:O2, repositorio institucional de la UOC instname:Universitat Oberta de Catalunya (UOC) |
| instname_str |
Universitat Oberta de Catalunya (UOC) |
| reponame_str |
O2, repositorio institucional de la UOC |
| collection |
O2, repositorio institucional de la UOC |
| repository.name.fl_str_mv |
|
| repository.mail.fl_str_mv |
|
| _version_ |
1869417233448435712 |
| score |
15,300724 |