Missing data: Imputación múltiple en bases de datos pequeñas
Un dato faltante o missing es información relevante para el análisis pero que, por diversos factores, no pudo ser registrado y como consecuencia, está ausente en las bases de datos de cualquier tipo, incluyendo los registros longitudinales. Los mismos, si no son tomados en cuenta, pueden influir sig...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2022 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/146106 |
| Acceso en línea: | http://hdl.handle.net/10609/146106 |
| Access Level: | acceso abierto |
| Palabra clave: | datos faltantes bioinformática VIH imputación múltiple missing data bioinformatics HIV multiple imputation dades faltants bioinformàtica imputació múltiple Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| Sumario: | Un dato faltante o missing es información relevante para el análisis pero que, por diversos factores, no pudo ser registrado y como consecuencia, está ausente en las bases de datos de cualquier tipo, incluyendo los registros longitudinales. Los mismos, si no son tomados en cuenta, pueden influir significativamente en el poder estadístico, la integridad del análisis, en estimaciones sesgadas y en la calidad de los resultados, por lo que es necesario un tratamiento correcto sobre los mismos, basado en las características que presenten. Este trabajo buscó poner a prueba diversas alternativas de imputación múltiple mediante la estrategia PMM, tratamiento moderno que ha generado buenos resultados, sobre los datos faltantes de una base de datos de pacientes con VIH, en tres escenarios de acuerdo al tamaño muestral. Una vez realizada las imputaciones, los resultados se pusieron a prueba, reproduciendo el análisis realizado en la publicación original de donde provienen los datos (comparación entre tratamientos), obteniendo resultados similares a los descritos. Se describió un flujo de trabajo recomendado para el análisis previo y tratamiento de missings, cuando la base de datos es longitudinal, con un tamaño muestral peque¿no, sin distribución normal y con altos porcentajes de datos faltantes, características que no suelen ponerse a prueba cuando se evalúan este tipo de métodos, pero que son frecuentes en diversos campos de investigación como la biología y la salud. |
|---|