Predicción de tiempo de fracaso de un tratamiento antirretroviral mediante algoritmos de machine learning de supervivencia
En este trabajo se realiza un estudio sobre el desempeño de los algoritmos de machine learning aplicados a los problemas de supervivencia. Se parte de una base de datos (la base de datos Lake) con multitud de datos faltantes, obtenida del ensayo clínico con el mismo nombre y en el que se ensayan dos...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2021 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/127626 |
| Acceso en línea: | http://hdl.handle.net/10609/127626 |
| Access Level: | acceso abierto |
| Palabra clave: | análisis de supervivencia aprendizaje automático imputación VIH machine learning imputation survival analysis anàlisi de supervivència aprenentatge automàtic imputació Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| Sumario: | En este trabajo se realiza un estudio sobre el desempeño de los algoritmos de machine learning aplicados a los problemas de supervivencia. Se parte de una base de datos (la base de datos Lake) con multitud de datos faltantes, obtenida del ensayo clínico con el mismo nombre y en el que se ensayan dos tratamientos antirretrovirales. La problemática de los datos faltantes es tremendamente común en los estudios longitudinales, entre los que se encuentran los ansayos clínicos. Además se realiza una comparación de la eficacia de dos tratamientos antirretrovirales ensayados. Para ello se realiza todo un primer procesamiento de los datos para prepararlos para un procedimiento de imputación múltiple, llevado a cabo utilizando la librería MICE. Una vez realizada esta imputación, sobre la base de datos imputada se aplicaron 3 algoritmos de machine learning (bosque aleatorio de supervivencia, máquina de soporte vectorial de supervivencia, y boosting). Con el fin de comparar su desempeño, y utilizando las predicciones de los algoritmos se calculó el índice C de Harrell. Finalmente, mediante el test de Wilcoxon para muestras pareadas, se comparó la eficacia de los tratamientos antirretrovirales ensayados. |
|---|