Exploratory analysis of a biological database (DEXA) and application of Machine Learning models to detect osteoporosis in HIV-positive patients

La incidència d'osteoporosi és major entre la població HIV+, per aquest motiu se'ls realitzen proves DEXA (densitometria òssia) de manera rutinària. Aquest treball s'ha centrat en estudiar una base de dades real, fruit de realitzar aquests anàlisis a pacients amb HIV. Les dades proced...

Descripción completa

Detalles Bibliográficos
Autor: Regué Alsina, Adrià
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/127526
Acceso en línea:http://hdl.handle.net/10609/127526
Access Level:acceso abierto
Palabra clave:HIV
DEXA
dimensionality reduction
graphical models
machine learning
VIH
reducción de dimensionalidad
modelos gráficos
aprendizaje automático
reducció de dimensionalitat
models gràfics
aprenentatge automàtic
Descripción
Sumario:La incidència d'osteoporosi és major entre la població HIV+, per aquest motiu se'ls realitzen proves DEXA (densitometria òssia) de manera rutinària. Aquest treball s'ha centrat en estudiar una base de dades real, fruit de realitzar aquests anàlisis a pacients amb HIV. Les dades procedeixen de pacients que realitzen el seguiment de la malaltia a la fundació "Lluita contra la SIDA" (Badalona). És comú que les variables en un estudi mèdic no siguin independents, sinó que estiguin fortament correlacionades. Per això el primer apartat del treball s'ha centrat en purificar la base de dades i descobrir correlacions entre variables mitjançant gràfics de correlacions i mètodes més innovadors com els models gràfics (GGM i MGM). També s'ha aplicat un anàlisi de reducció de la dimensionalitat utilitzant components principals. En aquest primer punt s'ha corroborat la rellevància que té el gènere en l'estudi. En conseqüència s'ha realitzat tot el treball posterior per cadascun dels gèneres per separat. Els models gràfics apunten a que la importància de les variables relacionades amb les vèrtebres és trivial a l'hora de calcular el mínim T-score (i per tant, a l'hora de diagnosticar osteoporosi). La segona part de l'estudi s'ha centrat en generar models predictius capaços de diagnosticar osteoporosis sense utilitzar els marcadors clàssics. S'han aplicat varis algoritmes de Machine Learning (Random Forests, SVM, k-NN) i s'ha generat un model capaç de classificar noves observacions amb una sensibilitat i especificitat del ~80%.