Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo

La secuenciación del genoma completo (WGS) resulta una aproximación de gran interés al permitir secuenciar el genoma completo de un individuo y posibilitar la detección de una mayor variedad de alteraciones genómicas en un único estudio. A día de hoy la tecnología más extendida por su antigüedad y c...

Descripción completa

Detalles Bibliográficos
Autor: Hidalgo Mayoral, Irene
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/146749
Acceso en línea:http://hdl.handle.net/10609/146749
Access Level:acceso abierto
Palabra clave:bioinformàtica
bioestadística
expansions
bioinformática
expansiones
bioinformatics
biostatistics
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
id ES_bb68e4e11487a91b45f8b2bd7a419f85
oai_identifier_str oai:openaccess.uoc.edu:10609/146749
network_acronym_str ES
network_name_str España
repository_id_str
dc.title.none.fl_str_mv Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
title Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
spellingShingle Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
Hidalgo Mayoral, Irene
bioinformàtica
bioestadística
expansions
bioinformática
bioestadística
expansiones
bioinformatics
biostatistics
expansions
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
title_short Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
title_full Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
title_fullStr Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
title_full_unstemmed Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
title_sort Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completo
dc.creator.none.fl_str_mv Hidalgo Mayoral, Irene
author Hidalgo Mayoral, Irene
author_facet Hidalgo Mayoral, Irene
author_role author
dc.contributor.none.fl_str_mv Merino, David
Lezana Rosales, Jose Miguel
Maynou Fernández, Joan
dc.subject.none.fl_str_mv bioinformàtica
bioestadística
expansions
bioinformática
bioestadística
expansiones
bioinformatics
biostatistics
expansions
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
topic bioinformàtica
bioestadística
expansions
bioinformática
bioestadística
expansiones
bioinformatics
biostatistics
expansions
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
description La secuenciación del genoma completo (WGS) resulta una aproximación de gran interés al permitir secuenciar el genoma completo de un individuo y posibilitar la detección de una mayor variedad de alteraciones genómicas en un único estudio. A día de hoy la tecnología más extendida por su antigüedad y coste es la short-read sequencing, que presenta un elevado rendimiento en la detección de variaciones puntuales e inserciones/deleciones de pequeño tamaño. En este trabajo se ha evaluado el potencial de distintas herramientas bioinformáticas en la detección de variaciones estructurales (SVs) y expansiones (STRs) a partir de datos de WGS short-read. Se han utilizado muestras reales obtenidas de repositorio con SVs y expansiones caracterizadas previamente. Se seleccionaron las herramientas Manta, Delly y Lumpy para la detección de SVs y ExpansionHunter, GangSTR y TREDParse para la detección de expansiones, escogidas en base al uso de métodos de detección combinados, un mayor rendimiento descrito en la literatura y/o un uso extendido en la comunidad científica. El rendimiento de las herramientas se ha valorado en términos de sensibilidad, especificidad, valor predictivo positivo, valor predictivo negativo y grado de concordancia entre detectores frente a un fichero gold-standard. Tras la evaluación se ha observado un rendimiento limitado de los detectores. En el caso de las SVs el desempeño es dependiente del tipo de alteración y de su tamaño, mientras que en el caso de las STRs su desempeño está en relación con el tamaño de la expansión y el contexto genómico de la región que la contiene.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022
2022
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/10609/146749
url http://hdl.handle.net/10609/146749
dc.language.none.fl_str_mv Español
language_invalid_str_mv Español
dc.rights.none.fl_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
dc.source.none.fl_str_mv reponame:O2, repositorio institucional de la UOC
instname:Universitat Oberta de Catalunya (UOC)
instname_str Universitat Oberta de Catalunya (UOC)
reponame_str O2, repositorio institucional de la UOC
collection O2, repositorio institucional de la UOC
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1869418023170867200
spelling Análisis de herramientas bioinformáticas para la detección de expansiones y alteraciones estructurales mediante secuenciación de genoma completoHidalgo Mayoral, IrenebioinformàticabioestadísticaexpansionsbioinformáticabioestadísticaexpansionesbioinformaticsbiostatisticsexpansionsBioinformatics -- TFMBioinformàtica -- TFMBioinformática -- TFMLa secuenciación del genoma completo (WGS) resulta una aproximación de gran interés al permitir secuenciar el genoma completo de un individuo y posibilitar la detección de una mayor variedad de alteraciones genómicas en un único estudio. A día de hoy la tecnología más extendida por su antigüedad y coste es la short-read sequencing, que presenta un elevado rendimiento en la detección de variaciones puntuales e inserciones/deleciones de pequeño tamaño. En este trabajo se ha evaluado el potencial de distintas herramientas bioinformáticas en la detección de variaciones estructurales (SVs) y expansiones (STRs) a partir de datos de WGS short-read. Se han utilizado muestras reales obtenidas de repositorio con SVs y expansiones caracterizadas previamente. Se seleccionaron las herramientas Manta, Delly y Lumpy para la detección de SVs y ExpansionHunter, GangSTR y TREDParse para la detección de expansiones, escogidas en base al uso de métodos de detección combinados, un mayor rendimiento descrito en la literatura y/o un uso extendido en la comunidad científica. El rendimiento de las herramientas se ha valorado en términos de sensibilidad, especificidad, valor predictivo positivo, valor predictivo negativo y grado de concordancia entre detectores frente a un fichero gold-standard. Tras la evaluación se ha observado un rendimiento limitado de los detectores. En el caso de las SVs el desempeño es dependiente del tipo de alteración y de su tamaño, mientras que en el caso de las STRs su desempeño está en relación con el tamaño de la expansión y el contexto genómico de la región que la contiene.Whole genome sequencing (WGS) is an interesting approach as it allows the complete genome of an individual to be sequenced and allows the possibility of detecting a greater variety of genomic alterations in a single study. Today, the most widespread technology due to its age and cost is short-read sequencing, which has a high performance in detecting point variations and small insertions/deletions. In this work, the potential of different bioinformatics tools in the detection of structural variations (SVs) and expansions (STRs) from WGS short-read data has been evaluated. Real samples obtained from the repository with previously characterized SVs and STRs have been used. The selected tools were Manta, Delly and Lumpy for SVs and ExpansionHunter, GangSTR and TREDParse for STRs, which were chosen based on the use of combined detection methods, higher performance described in the literature, and widespread use in the scientific community. Their performance has been assessed in terms of sensitivity, specificity, positive predictive value, negative predictive value and degree of agreement between detectors against a gold standard file. After evaluation, limited performance of the detectors has been observed. For SVs, its performance is dependent on the type and size of the event, while in the case of STRs, its performance is related to the size of the expansion and the genomic context of the region that contains it.La seqüenciació del genoma complet (WGS) resulta una aproximació de gran interès en permetre seqüenciar el genoma complet d'un individu i possibilitar la detecció d'una major varietat d'alteracions genòmiques en un únic estudi. Avui dia la tecnologia més estesa per la seva antiguitat i cost és la short-*read sequencing, que presenta un elevat rendiment en la detecció de variacions puntuals i insercions/delecions de petita grandària. En aquest treball s'ha avaluat el potencial de diferents eines bioinformàtiques en la detecció de variacions estructurals (SVs) i expansions (STRs) a partir de dades de WGS short-*read. S'han utilitzat mostres reals obtingudes de repositori amb SVs i expansions caracteritzades prèviament. Es van seleccionar les eines Manta, Delly i Lumpy per a la detecció de SVs i ExpansionHunter, GangSTR i TREDParse per a la detecció d'expansions, triades sobre la base de l'ús de mètodes de detecció combinats, un major rendiment descrit en la literatura i/o un ús estès en la comunitat científica. El rendiment de les eines s'ha valorat en termes de sensibilitat, especificitat, valor predictiu positiu, valor predictiu negatiu i grau de concordança entre detectors enfront d'un fitxer gold-*standard. Després de l'avaluació s'ha observat un rendiment limitat dels detectors. En el cas de les SVs l'acompliment és dependent del tipus d'alteració i de la seva grandària, mentre que en el cas de les STRs el seu acompliment està en relació amb la grandària de l'expansió i el context genòmic de la regió que la conté.Universitat Oberta de Catalunya (UOC)Merino, DavidLezana Rosales, Jose MiguelMaynou Fernández, Joan202220222021info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/146749reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)EspañolCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1467492026-05-28T12:42:01Z
score 15,300724