Predicción de tiempo de fracaso de un tratamiento antirretroviral mediante algoritmos de machine learning de supervivencia

En este trabajo se realiza un estudio sobre el desempeño de los algoritmos de machine learning aplicados a los problemas de supervivencia. Se parte de una base de datos (la base de datos Lake) con multitud de datos faltantes, obtenida del ensayo clínico con el mismo nombre y en el que se ensayan dos...

Descripción completa

Detalles Bibliográficos
Autor: Amado Bouza, Javier
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/127626
Acceso en línea:http://hdl.handle.net/10609/127626
Access Level:acceso abierto
Palabra clave:análisis de supervivencia
aprendizaje automático
imputación
VIH
machine learning
imputation
survival analysis
anàlisi de supervivència
aprenentatge automàtic
imputació
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descripción
Sumario:En este trabajo se realiza un estudio sobre el desempeño de los algoritmos de machine learning aplicados a los problemas de supervivencia. Se parte de una base de datos (la base de datos Lake) con multitud de datos faltantes, obtenida del ensayo clínico con el mismo nombre y en el que se ensayan dos tratamientos antirretrovirales. La problemática de los datos faltantes es tremendamente común en los estudios longitudinales, entre los que se encuentran los ansayos clínicos. Además se realiza una comparación de la eficacia de dos tratamientos antirretrovirales ensayados. Para ello se realiza todo un primer procesamiento de los datos para prepararlos para un procedimiento de imputación múltiple, llevado a cabo utilizando la librería MICE. Una vez realizada esta imputación, sobre la base de datos imputada se aplicaron 3 algoritmos de machine learning (bosque aleatorio de supervivencia, máquina de soporte vectorial de supervivencia, y boosting). Con el fin de comparar su desempeño, y utilizando las predicciones de los algoritmos se calculó el índice C de Harrell. Finalmente, mediante el test de Wilcoxon para muestras pareadas, se comparó la eficacia de los tratamientos antirretrovirales ensayados.