Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients

La incidència d'osteoporosi és major entre la població HIV+, per aquest motiu se'ls realitzen proves DEXA (densitometria òssia) de manera rutinària. Aquest treball s'ha centrat en estudiar una base de dades real, fruit de realitzar aquests anàlisis a pacients amb HIV. Les dades proced...

Descripción completa

Detalles Bibliográficos
Autor: Regué Alsina, Adrià
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/127526
Acceso en línea:http://hdl.handle.net/10609/127526
Access Level:acceso abierto
Palabra clave:HIV
DEXA
dimensionality reduction
graphical models
machine learning
VIH
reducción de dimensionalidad
modelos gráficos
aprendizaje automático
reducció de dimensionalitat
models gràfics
aprenentatge automàtic
id ES_115f90edb38112efa7cd9db9f60fc6cd
oai_identifier_str oai:openaccess.uoc.edu:10609/127526
network_acronym_str ES
network_name_str España
repository_id_str
dc.title.none.fl_str_mv Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
title Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
spellingShingle Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
Regué Alsina, Adrià
HIV
DEXA
dimensionality reduction
graphical models
machine learning
VIH
DEXA
reducción de dimensionalidad
modelos gráficos
aprendizaje automático
VIH
DEXA
reducció de dimensionalitat
models gràfics
aprenentatge automàtic
title_short Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
title_full Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
title_fullStr Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
title_full_unstemmed Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
title_sort Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients
dc.creator.none.fl_str_mv Regué Alsina, Adrià
author Regué Alsina, Adrià
author_facet Regué Alsina, Adrià
author_role author
dc.contributor.none.fl_str_mv Maceira, Marc
Perez-Alvarez, Nuria
dc.subject.none.fl_str_mv HIV
DEXA
dimensionality reduction
graphical models
machine learning
VIH
DEXA
reducción de dimensionalidad
modelos gráficos
aprendizaje automático
VIH
DEXA
reducció de dimensionalitat
models gràfics
aprenentatge automàtic
topic HIV
DEXA
dimensionality reduction
graphical models
machine learning
VIH
DEXA
reducción de dimensionalidad
modelos gráficos
aprendizaje automático
VIH
DEXA
reducció de dimensionalitat
models gràfics
aprenentatge automàtic
description La incidència d'osteoporosi és major entre la població HIV+, per aquest motiu se'ls realitzen proves DEXA (densitometria òssia) de manera rutinària. Aquest treball s'ha centrat en estudiar una base de dades real, fruit de realitzar aquests anàlisis a pacients amb HIV. Les dades procedeixen de pacients que realitzen el seguiment de la malaltia a la fundació "Lluita contra la SIDA" (Badalona). És comú que les variables en un estudi mèdic no siguin independents, sinó que estiguin fortament correlacionades. Per això el primer apartat del treball s'ha centrat en purificar la base de dades i descobrir correlacions entre variables mitjançant gràfics de correlacions i mètodes més innovadors com els models gràfics (GGM i MGM). També s'ha aplicat un anàlisi de reducció de la dimensionalitat utilitzant components principals. En aquest primer punt s'ha corroborat la rellevància que té el gènere en l'estudi. En conseqüència s'ha realitzat tot el treball posterior per cadascun dels gèneres per separat. Els models gràfics apunten a que la importància de les variables relacionades amb les vèrtebres és trivial a l'hora de calcular el mínim T-score (i per tant, a l'hora de diagnosticar osteoporosi). La segona part de l'estudi s'ha centrat en generar models predictius capaços de diagnosticar osteoporosis sense utilitzar els marcadors clàssics. S'han aplicat varis algoritmes de Machine Learning (Random Forests, SVM, k-NN) i s'ha generat un model capaç de classificar noves observacions amb una sensibilitat i especificitat del ~80%.
publishDate 2021
dc.date.none.fl_str_mv 2021
2021
2021
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/10609/127526
url http://hdl.handle.net/10609/127526
dc.language.none.fl_str_mv Inglés
language_invalid_str_mv Inglés
dc.rights.none.fl_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
dc.source.none.fl_str_mv reponame:O2, repositorio institucional de la UOC
instname:Universitat Oberta de Catalunya (UOC)
instname_str Universitat Oberta de Catalunya (UOC)
reponame_str O2, repositorio institucional de la UOC
collection O2, repositorio institucional de la UOC
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1869403561406758912
spelling Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patientsRegué Alsina, AdriàHIVDEXAdimensionality reductiongraphical modelsmachine learningVIHDEXAreducción de dimensionalidadmodelos gráficosaprendizaje automáticoVIHDEXAreducció de dimensionalitatmodels gràficsaprenentatge automàticLa incidència d'osteoporosi és major entre la població HIV+, per aquest motiu se'ls realitzen proves DEXA (densitometria òssia) de manera rutinària. Aquest treball s'ha centrat en estudiar una base de dades real, fruit de realitzar aquests anàlisis a pacients amb HIV. Les dades procedeixen de pacients que realitzen el seguiment de la malaltia a la fundació "Lluita contra la SIDA" (Badalona). És comú que les variables en un estudi mèdic no siguin independents, sinó que estiguin fortament correlacionades. Per això el primer apartat del treball s'ha centrat en purificar la base de dades i descobrir correlacions entre variables mitjançant gràfics de correlacions i mètodes més innovadors com els models gràfics (GGM i MGM). També s'ha aplicat un anàlisi de reducció de la dimensionalitat utilitzant components principals. En aquest primer punt s'ha corroborat la rellevància que té el gènere en l'estudi. En conseqüència s'ha realitzat tot el treball posterior per cadascun dels gèneres per separat. Els models gràfics apunten a que la importància de les variables relacionades amb les vèrtebres és trivial a l'hora de calcular el mínim T-score (i per tant, a l'hora de diagnosticar osteoporosi). La segona part de l'estudi s'ha centrat en generar models predictius capaços de diagnosticar osteoporosis sense utilitzar els marcadors clàssics. S'han aplicat varis algoritmes de Machine Learning (Random Forests, SVM, k-NN) i s'ha generat un model capaç de classificar noves observacions amb una sensibilitat i especificitat del ~80%.Osteoporosis incidence is notoriously larger in the HIV-positive population. For this reason, DEXA analysis (bone densitometry tests) are conducted as a control technique. This work focuses on studying a real DEXA database, retrieved from HIV+ patients doing medical checkups in the Lluita contra la SIDA Foundation, in Badalona. Medical databases often suffer from strong correlations between variables. For this reason, the first chapter of the study has been destinated to purify the database and discover said relationships, via correlation plots and more innovative techniques such as graphical models (GGMs and MGMs). Also, a dimensionality reduction analysis has been executed using principal components. This first part of the study corroborated the relevance of the gender variable. All the subsequent analysis has been conducted separately for men and women. Also, graphical models suggested that vertebral variables have a rather weak importance in determining the minimum T-score (and thus, predicting osteoporosis). The second part of the study has focused on generating a predictive model with the ability to diagnose osteoporosis without using its classical indicator variables. After modelling with various Machine Learning algorithms (Random Forests, SVMs, k-NNs), a classificatory model has been generated, reporting a sensitivity and specificity of ~80%.La incidencia de osteoporosis es mayor entre la población VIH +, de ahí que se les realizan pruebas DEXA (densitometría ósea) de manera rutinaria. Este trabajo se ha centrado en estudiar una base de datos real, fruto de realizar estos análisis en pacientes con VIH. Los datos proceden de pacientes que realizan el seguimiento de la enfermedad a la fundación "Lucha contra el SIDA" (Badalona). Es común que las variables en un estudio médico no sean independientes, sino que estén fuertemente correlacionadas. Por eso el primer apartado del trabajo se ha centrado en purificar la base de datos y descubrir correlaciones entre variables mediante gráficos de correlaciones y métodos más innovadores como los modelos gráficos (GGM y MGM). También se ha aplicado un análisis de reducción de la dimensionalidad utilizando componentes principales. En este primer punto se ha corroborado la relevancia que tiene el género en el estudio. En consecuencia se ha realizado todo el trabajo posterior para cada uno de los géneros por separado. Los modelos gráficos apuntan a que la importancia de las variables relacionadas con las vértebras es trivial a la hora de calcular el mínimo T-score (y por tanto, a la hora de diagnosticar osteoporosis). La segunda parte del estudio se ha centrado en generar modelos predictivos capaces de diagnosticar osteoporosis sin utilizar los marcadores clásicos. Se han aplicado varios algoritmos de Machine Learning (Random Forests, SVM, k-NN) y se ha generado un modelo capaz de clasificar nuevas observaciones con una sensibilidad y especificidad del ~ 80%.Universitat Oberta de Catalunya (UOC)Maceira, MarcPerez-Alvarez, Nuria202120212021info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/127526reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)InglésCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1275262026-05-28T12:42:01Z
score 15,300724