Estrategias para el abordaje de la problemática de los datos faltantes en ensayos clínicos longitudinales

Los ensayos clínicos longitudinales se hacen con medidas repetidas de algunas variables a lo largo de un tiempo. Es un problema frecuente encontrarnos con que alguna de estas medidas falta. Desarrollar estrategias adecuadas en el tratamiento de datos faltantes supone un gran reto. Una de las alterna...

Descripción completa

Detalles Bibliográficos
Autor: Pardo Montenegro, Beatriz
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/139067
Acceso en línea:http://hdl.handle.net/10609/139067
Access Level:acceso abierto
Palabra clave:datos faltantes
imputación
análisis supervivencia
ensayos longitudinales
dades que manca
imputació
anàlisi supervivència
assajos longitudinals
missing data
imputation
survival analysis
longitudinal trials
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descripción
Sumario:Los ensayos clínicos longitudinales se hacen con medidas repetidas de algunas variables a lo largo de un tiempo. Es un problema frecuente encontrarnos con que alguna de estas medidas falta. Desarrollar estrategias adecuadas en el tratamiento de datos faltantes supone un gran reto. Una de las alternativas recomendadas es la imputación múltiple. Los análisis de supervivencia analizan el tiempo que tarda en ocurrir un evento de interés, si éste no ocurre en el tiempo de seguimiento del ensayo, se denomina censura. Existen numerosas alternativas para la realización de análisis de supervivencia con datos censurados, el método convencional más utilizado es Kaplan Meier. En los últimos años se han desarrollado algoritmos de machine learning, uno de ellos es random survival forest. En este TFM, tras realizar labores de data management, se realiza imputación de datos faltantes de la base de datos del ensayo Lake con 2 opciones de imputación disponibles en R, en las librerías mice y randomForestSRC. Se comparan los resultados de la función de supervivencia de Kaplan Meier y del algoritmo random survival forest aplicados al resultado de ambas imputaciones. El evento estudiado es fracaso virológico en pacientes diagnosticados de VIH tratados con tratamiento experimental vs control. Los resultados del índice C son muy similares. Por Kaplan Meier, se concluye que el tratamiento experimental tiene menos fracasos virológicos que el tratamiento estándar, pero las diferencias son significativas sólo en la base de datos imputada con la librería randomForestSRC.