Missing data: Imputación múltiple en bases de datos pequeñas

Un dato faltante o missing es información relevante para el análisis pero que, por diversos factores, no pudo ser registrado y como consecuencia, está ausente en las bases de datos de cualquier tipo, incluyendo los registros longitudinales. Los mismos, si no son tomados en cuenta, pueden influir sig...

ver descrição completa

Detalhes bibliográficos
Autor: Hernández Villena, Juan Vicente
Formato: tesis de maestría
Fecha de publicación:2022
País:España
Recursos:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/146106
Acesso em linha:http://hdl.handle.net/10609/146106
Access Level:acceso abierto
Palavra-chave:datos faltantes
bioinformática
VIH
imputación múltiple
missing data
bioinformatics
HIV
multiple imputation
dades faltants
bioinformàtica
imputació múltiple
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descrição
Resumo:Un dato faltante o missing es información relevante para el análisis pero que, por diversos factores, no pudo ser registrado y como consecuencia, está ausente en las bases de datos de cualquier tipo, incluyendo los registros longitudinales. Los mismos, si no son tomados en cuenta, pueden influir significativamente en el poder estadístico, la integridad del análisis, en estimaciones sesgadas y en la calidad de los resultados, por lo que es necesario un tratamiento correcto sobre los mismos, basado en las características que presenten. Este trabajo buscó poner a prueba diversas alternativas de imputación múltiple mediante la estrategia PMM, tratamiento moderno que ha generado buenos resultados, sobre los datos faltantes de una base de datos de pacientes con VIH, en tres escenarios de acuerdo al tamaño muestral. Una vez realizada las imputaciones, los resultados se pusieron a prueba, reproduciendo el análisis realizado en la publicación original de donde provienen los datos (comparación entre tratamientos), obteniendo resultados similares a los descritos. Se describió un flujo de trabajo recomendado para el análisis previo y tratamiento de missings, cuando la base de datos es longitudinal, con un tamaño muestral peque¿no, sin distribución normal y con altos porcentajes de datos faltantes, características que no suelen ponerse a prueba cuando se evalúan este tipo de métodos, pero que son frecuentes en diversos campos de investigación como la biología y la salud.