Desarrollo de un pipeline bioinformático mediante R: análisis basados en panel de cáncer de pulmón

En la actualidad, el cáncer de pulmón es uno de los tipos de cáncer más comunes y de los más extensos. En comparación con el resto de cánceres, alrededor del 14% de todos los cánceres nuevos son cánceres procedentes de este órgano. Debido a las altas estadísticas, se cree interesante envolver el pre...

Descripción completa

Detalles Bibliográficos
Autor: Masip Galaso, David
Tipo de recurso: tesis de maestría
Fecha de publicación:2019
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/96847
Acceso en línea:http://hdl.handle.net/10609/96847
Access Level:acceso abierto
Palabra clave:lung cancer
FASTQ files
data mining
cáncer de pulmón
minería de datos
càncer de pulmó
mineria de dades
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descripción
Sumario:En la actualidad, el cáncer de pulmón es uno de los tipos de cáncer más comunes y de los más extensos. En comparación con el resto de cánceres, alrededor del 14% de todos los cánceres nuevos son cánceres procedentes de este órgano. Debido a las altas estadísticas, se cree interesante envolver el presente trabajo de Fin de Máster con la realización de un pipeline bioinformático a partir de un panel de genes de cáncer de pulmón. Para ello, se parte de una base con datos tipo Fastq files procedente de un panel de genes para su posterior parametrización [1][2][3][4]. Con el presente objetivo y en plena expansión e integración genómica en el campo del diagnóstico clínico, encontramos una razón de peso para la ejecución de dicho particular estudio dentro del campo de diagnóstico. El tipo de lenguaje utilizado para este proyecto será la plataforma de software libre R y sus distintos paquetes de Bioconductor utilizados a lo largo del pipeline, los cuáles nos permitirán filtrar y definir con gran detalle toda la información proveniente de los archivos seleccionados, sacar datos estadísticos representarlos de una forma rápida, simple, coherente y de la mejor manera posible. Esta aplicación puede utilizarse para cualquier tipo de estudio siempre y cuando el punto de inicio sea una base con datos de clase fastq files, ya sea precedente de Pubmed, de cualquier tipo de panel de genes procedentes de un secuenciador o de cualquier otra fuente. Al publicarse en la red, ésta además puede ser utilizada por cualquier usuario, incluso aquellos sin conocimientos en lenguajes de programación específico.