Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado

El conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo...

Descripción completa

Detalles Bibliográficos
Autor: Sánchez Temporal, Raúl
Tipo de recurso: tesis de maestría
Fecha de publicación:2020
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/107266
Acceso en línea:http://hdl.handle.net/10609/107266
Access Level:acceso abierto
Palabra clave:NHANES
machine learning
clustering
aprenentatge automàtic
aprendizaje automático
Machine learning -- TFM
Aprenentatge automàtic -- TFM
Aprendizaje automático -- TFM
id ES_b41bce67faebcc769eb850e02400d707
oai_identifier_str oai:openaccess.uoc.edu:10609/107266
network_acronym_str ES
network_name_str España
repository_id_str
spelling Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisadoSánchez Temporal, RaúlNHANESmachine learningclusteringNHANESaprenentatge automàticclusteringNHANESaprendizaje automáticoclusteringMachine learning -- TFMAprenentatge automàtic -- TFMAprendizaje automático -- TFMEl conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo se propone el uso de técnicas de aprendizaje no supervisado aplicado sobre los datos NHANES con el objetivo de detectar patrones que permitan perfilar a los pacientes en base a sus similitudes encontrando grupos (clústeres) naturales para estos. En concreto el trabajo se centra en el uso de métodos de agrupamiento basados en densidad y métodos jerárquicos. A su vez se crea una interfaz web que permite la clasificación de los pacientes en los diferentes clústeres que se generen. Para el desarrollo del trabajo se sigue la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) ampliamente adoptada para proyectos de minería de datos que proporciona la descripción del ciclo de vida donde se definen las tareas necesarias para cada fase.El conjunt de dades National Health and Nutrition Examination Survey (NHANES) facilitat pel Centre de Control de malalties i Prevenció (CDC) suposa una oportunitat única per a dur a terme recerques i anàlisis que puguin ajudar en la millora de la salut de les persones. En aquest treball es proposa l'ús de tècniques d'aprenentatge no supervisat aplicat sobre les dades NHANES amb l'objectiu de detectar patrons que permetin perfilar als pacients sobre la base de les seves similituds trobant grups (clústers) naturals per a aquests. En concret el treball se centra en l'ús de mètodes d'agrupament basats en densitat i mètodes jeràrquics. Al seu torn es crea una interfície web que permet la classificació dels pacients en els diferents clústers que es generin. Per al desenvolupament del treball se segueix la metodologia Cross Industry Standard Process for Data Mining (CRISP-DM) àmpliament adoptada per a projectes de mineria de dades que proporciona la descripció del cicle de vida on es defineixen les tasques necessàries per a cada fase.The National Survey of Health and Nutrition Survey (NHANES) data set provided by the Center for Disease Control and Prevention (CDC) is a unique opportunity to conduct research and analysis that can help improve the health of people. This paper proposes the use of unsupervised learning techniques applied to NHANES data in order to detect patterns that adapt to patients based on their similarities by finding natural groups (clusters) for them. Specifically, the work focuses on the use of methods of grouping methods in density and hierarchical methods. In addition, a web interface is created that allows the classification of patients in the different clusters that are generated. For the development of the work, the Cross Industry Standard Process for Data Mining (CRISP-DM) methodology is followed, which is widely adopted for data mining projects that describe the life cycle where the necessary tasks are defined for each phase.Universitat Oberta de Catalunya (UOC)Prados Carrasco, FerranSubirats, Laia202020202020info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/107266reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)EspañolCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1072662026-05-28T12:42:01Z
dc.title.none.fl_str_mv Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
title Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
spellingShingle Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
Sánchez Temporal, Raúl
NHANES
machine learning
clustering
NHANES
aprenentatge automàtic
clustering
NHANES
aprendizaje automático
clustering
Machine learning -- TFM
Aprenentatge automàtic -- TFM
Aprendizaje automático -- TFM
title_short Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
title_full Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
title_fullStr Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
title_full_unstemmed Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
title_sort Estudio del conjunto de datos NHANES mediante el empleo de técnicas de aprendizaje no supervisado
dc.creator.none.fl_str_mv Sánchez Temporal, Raúl
author Sánchez Temporal, Raúl
author_facet Sánchez Temporal, Raúl
author_role author
dc.contributor.none.fl_str_mv Prados Carrasco, Ferran
Subirats, Laia
dc.subject.none.fl_str_mv NHANES
machine learning
clustering
NHANES
aprenentatge automàtic
clustering
NHANES
aprendizaje automático
clustering
Machine learning -- TFM
Aprenentatge automàtic -- TFM
Aprendizaje automático -- TFM
topic NHANES
machine learning
clustering
NHANES
aprenentatge automàtic
clustering
NHANES
aprendizaje automático
clustering
Machine learning -- TFM
Aprenentatge automàtic -- TFM
Aprendizaje automático -- TFM
description El conjunto de datos National Health and Nutrition Examination Survey (NHANES) facilitado por el Centro de Control de enfermedades y Prevención (CDC) supone una oportunidad única para llevar a cabo investigaciones y análisis que puedan ayudar en la mejora de la salud de las personas. En este trabajo se propone el uso de técnicas de aprendizaje no supervisado aplicado sobre los datos NHANES con el objetivo de detectar patrones que permitan perfilar a los pacientes en base a sus similitudes encontrando grupos (clústeres) naturales para estos. En concreto el trabajo se centra en el uso de métodos de agrupamiento basados en densidad y métodos jerárquicos. A su vez se crea una interfaz web que permite la clasificación de los pacientes en los diferentes clústeres que se generen. Para el desarrollo del trabajo se sigue la metodología Cross Industry Standard Process for Data Mining (CRISP-DM) ampliamente adoptada para proyectos de minería de datos que proporciona la descripción del ciclo de vida donde se definen las tareas necesarias para cada fase.
publishDate 2020
dc.date.none.fl_str_mv 2020
2020
2020
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/10609/107266
url http://hdl.handle.net/10609/107266
dc.language.none.fl_str_mv Español
language_invalid_str_mv Español
dc.rights.none.fl_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
dc.source.none.fl_str_mv reponame:O2, repositorio institucional de la UOC
instname:Universitat Oberta de Catalunya (UOC)
instname_str Universitat Oberta de Catalunya (UOC)
reponame_str O2, repositorio institucional de la UOC
collection O2, repositorio institucional de la UOC
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1869417233448435712
score 15,300724