Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal

The inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to f...

Descripción completa

Detalles Bibliográficos
Autor: Castillo Rosa, Eva
Tipo de recurso: tesis de maestría
Fecha de publicación:2020
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/121346
Acceso en línea:http://hdl.handle.net/10609/121346
Access Level:acceso abierto
Palabra clave:microbiota
machine learning
shiny
brillant
aprenentatge automàtic
brillante
aprendizaje automático
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
id ES_bf31d7e3f8a7b8ebdd20ca0101cf37bd
oai_identifier_str oai:openaccess.uoc.edu:10609/121346
network_acronym_str ES
network_name_str España
repository_id_str
dc.title.none.fl_str_mv Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
title Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
spellingShingle Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
Castillo Rosa, Eva
microbiota
machine learning
shiny
brillant
aprenentatge automàtic
microbiota
brillante
aprendizaje automático
microbiota
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
title_short Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
title_full Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
title_fullStr Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
title_full_unstemmed Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
title_sort Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
dc.creator.none.fl_str_mv Castillo Rosa, Eva
author Castillo Rosa, Eva
author_facet Castillo Rosa, Eva
author_role author
dc.contributor.none.fl_str_mv Canovas Izquierdo, Javier Luis
Maceira, Marc
Adsuar Gómez, Antonio Jesús
dc.subject.none.fl_str_mv microbiota
machine learning
shiny
brillant
aprenentatge automàtic
microbiota
brillante
aprendizaje automático
microbiota
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
topic microbiota
machine learning
shiny
brillant
aprenentatge automàtic
microbiota
brillante
aprendizaje automático
microbiota
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
description The inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to find the optimal ones and apply it to the discovery of biomarkers or, ultimately, clinical diagnosis. In this study, the microbial diversity of biopsy samples from healthy, Crohn's disease or ulcerative colitis patients was analysed with QIIME 2 software. Various supervised machine learning methods have been applied from bacterial relative abundance data to sample classification. Finally, an interactive web application has been developed in order to adapt the optimal models to the user's input data. Although some linear models show similar performance to complex ones, the model with the highest performance is random forest. Besides, choosing a good dimensionality reduction method is important when applying machine learning on microbiome data. Just as crucial as making these analyses available to the entire scientific community, so that large-scale studies can be done.
publishDate 2020
dc.date.none.fl_str_mv 2020
2020
2020
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.none.fl_str_mv http://hdl.handle.net/10609/121346
url http://hdl.handle.net/10609/121346
dc.language.none.fl_str_mv Español
language_invalid_str_mv Español
dc.rights.none.fl_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-ND
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
publisher.none.fl_str_mv Universitat Oberta de Catalunya (UOC)
dc.source.none.fl_str_mv reponame:O2, repositorio institucional de la UOC
instname:Universitat Oberta de Catalunya (UOC)
instname_str Universitat Oberta de Catalunya (UOC)
reponame_str O2, repositorio institucional de la UOC
collection O2, repositorio institucional de la UOC
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1869418349088210944
spelling Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinalCastillo Rosa, Evamicrobiotamachine learningshinybrillantaprenentatge automàticmicrobiotabrillanteaprendizaje automáticomicrobiotaBioinformatics -- TFMBioinformàtica -- TFMBioinformática -- TFMThe inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to find the optimal ones and apply it to the discovery of biomarkers or, ultimately, clinical diagnosis. In this study, the microbial diversity of biopsy samples from healthy, Crohn's disease or ulcerative colitis patients was analysed with QIIME 2 software. Various supervised machine learning methods have been applied from bacterial relative abundance data to sample classification. Finally, an interactive web application has been developed in order to adapt the optimal models to the user's input data. Although some linear models show similar performance to complex ones, the model with the highest performance is random forest. Besides, choosing a good dimensionality reduction method is important when applying machine learning on microbiome data. Just as crucial as making these analyses available to the entire scientific community, so that large-scale studies can be done.La enfermedad inflamatoria intestinal engloba una serie de desórdenes con síntomas muy similares. Por ello, saber qué bacterias están presentes en la microbiota de los pacientes con este tipo de trastornos es útil para su diagnóstico y tratamiento. Para poder estudiar la relación subyacente de los microorganismos que habitan en la microbiota con el fenotipo de la enfermedad se han utilizado técnicas de machine learning. Es crucial un buen estudio de los diferentes algoritmos de clasificación disponibles para poder aplicar aquellos óptimos al descubrimiento de marcadores específicos de la enfermedad o, en última instancia, al diagnóstico clínico. En este trabajo se ha analizado la diversidad microbiana de muestras de biopsia de pacientes sanos, con enfermedad de Crohn o colitis ulcerosa usando el software QIIME 2TM. A partir de los datos de abundancia relativa bacteriana se han aplicado diversas metodologías de aprendizaje supervisado para la clasificación de las muestras. Finalmente, se ha desarrollado una aplicación web interactiva para adaptar los modelos óptimos a los datos de entrada del usuario. Aunque hay modelos lineales que muestran un rendimiento parecido a otros más complejos, el modelo que mayor capacidad predictiva tiene es random forest. Por otra parte, la elección de un buen método de reducción de la dimensionalidad es muy importante a la hora de aplicar machine learning sobre datos de microbioma. Al igual que es crucial facilitar la disponibilidad de estos análisis a toda la comunidad científica, que permitan hacer estudios a mayor escala.La malaltia inflamatòria intestinal engloba una sèrie de desordres amb símptomes molt similars. Per això, saber què bacteris estan presents en la microbiota dels pacients amb aquest tipus de trastorns és útil per al seu diagnòstic i tractament. Per poder estudiar la relació subjacent dels microorganismes que habiten a la microbiota amb el fenotip de la malaltia s'han utilitzat tècniques de machine learning. És crucial un bon estudi dels diferents algoritmes de classificació disponibles per poder aplicar aquells òptims a la descoberta de marcadors específics de la malaltia o, en última instància, a el diagnòstic clínic. En aquest treball s'ha analitzat la diversitat microbiana de mostres de biòpsia de pacients sans, amb malaltia de Crohn o colitis ulcerosa usant el programari QIIME 2Tm. A partir de les dades d'abundància relativa bacteriana s'han aplicat diverses metodologies d'aprenentatge supervisat per a la classificació de les mostres. Finalment, s'ha desenvolupat una aplicació web interactiva per adaptar els models òptims a les dades d'entrada de l'usuari. Encara que hi ha models lineals que mostren un rendiment semblant a altres més complexos, el model que més capacitat predictiva té és random forest. D'altra banda, l'elecció d'un bon mètode de reducció de la dimensionalitat és molt important a l'hora d'aplicar machine learning sobre dades de microbioma. A l'igual que és crucial facilitar la disponibilitat d'aquestes anàlisis a tota la comunitat científica, que permetin fer estudis a major escala.Universitat Oberta de Catalunya (UOC)Canovas Izquierdo, Javier LuisMaceira, MarcAdsuar Gómez, Antonio Jesús202020202020info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/121346reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)EspañolCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1213462026-05-28T12:42:01Z
score 15.300724