Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal
The inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to f...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2020 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/121346 |
| Acceso en línea: | http://hdl.handle.net/10609/121346 |
| Access Level: | acceso abierto |
| Palabra clave: | microbiota machine learning shiny brillant aprenentatge automàtic brillante aprendizaje automático Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| id |
ES_bf31d7e3f8a7b8ebdd20ca0101cf37bd |
|---|---|
| oai_identifier_str |
oai:openaccess.uoc.edu:10609/121346 |
| network_acronym_str |
ES |
| network_name_str |
España |
| repository_id_str |
|
| dc.title.none.fl_str_mv |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| title |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| spellingShingle |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal Castillo Rosa, Eva microbiota machine learning shiny brillant aprenentatge automàtic microbiota brillante aprendizaje automático microbiota Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| title_short |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| title_full |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| title_fullStr |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| title_full_unstemmed |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| title_sort |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinal |
| dc.creator.none.fl_str_mv |
Castillo Rosa, Eva |
| author |
Castillo Rosa, Eva |
| author_facet |
Castillo Rosa, Eva |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Canovas Izquierdo, Javier Luis Maceira, Marc Adsuar Gómez, Antonio Jesús |
| dc.subject.none.fl_str_mv |
microbiota machine learning shiny brillant aprenentatge automàtic microbiota brillante aprendizaje automático microbiota Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| topic |
microbiota machine learning shiny brillant aprenentatge automàtic microbiota brillante aprendizaje automático microbiota Bioinformatics -- TFM Bioinformàtica -- TFM Bioinformática -- TFM |
| description |
The inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to find the optimal ones and apply it to the discovery of biomarkers or, ultimately, clinical diagnosis. In this study, the microbial diversity of biopsy samples from healthy, Crohn's disease or ulcerative colitis patients was analysed with QIIME 2 software. Various supervised machine learning methods have been applied from bacterial relative abundance data to sample classification. Finally, an interactive web application has been developed in order to adapt the optimal models to the user's input data. Although some linear models show similar performance to complex ones, the model with the highest performance is random forest. Besides, choosing a good dimensionality reduction method is important when applying machine learning on microbiome data. Just as crucial as making these analyses available to the entire scientific community, so that large-scale studies can be done. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020 2020 2020 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.none.fl_str_mv |
http://hdl.handle.net/10609/121346 |
| url |
http://hdl.handle.net/10609/121346 |
| dc.language.none.fl_str_mv |
Español |
| language_invalid_str_mv |
Español |
| dc.rights.none.fl_str_mv |
CC BY-NC-ND http://creativecommons.org/licenses/by-nc-nd/3.0/es/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
CC BY-NC-ND http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf application/pdf |
| dc.publisher.none.fl_str_mv |
Universitat Oberta de Catalunya (UOC) |
| publisher.none.fl_str_mv |
Universitat Oberta de Catalunya (UOC) |
| dc.source.none.fl_str_mv |
reponame:O2, repositorio institucional de la UOC instname:Universitat Oberta de Catalunya (UOC) |
| instname_str |
Universitat Oberta de Catalunya (UOC) |
| reponame_str |
O2, repositorio institucional de la UOC |
| collection |
O2, repositorio institucional de la UOC |
| repository.name.fl_str_mv |
|
| repository.mail.fl_str_mv |
|
| _version_ |
1869418349088210944 |
| spelling |
Análisis de técnicas de clasificación de perfiles taxonómicos para predecir trastornos de la enfermedad inflamatoria intestinalCastillo Rosa, Evamicrobiotamachine learningshinybrillantaprenentatge automàticmicrobiotabrillanteaprendizaje automáticomicrobiotaBioinformatics -- TFMBioinformàtica -- TFMBioinformática -- TFMThe inflammatory bowel disease comprises a wide range of disorders with similar symptoms. Therefore, studying the bacteria present in the microbiota of patients is key for the diagnosis and treatment of these diseases. A thorough study of different available classification algorithms is crucial to find the optimal ones and apply it to the discovery of biomarkers or, ultimately, clinical diagnosis. In this study, the microbial diversity of biopsy samples from healthy, Crohn's disease or ulcerative colitis patients was analysed with QIIME 2 software. Various supervised machine learning methods have been applied from bacterial relative abundance data to sample classification. Finally, an interactive web application has been developed in order to adapt the optimal models to the user's input data. Although some linear models show similar performance to complex ones, the model with the highest performance is random forest. Besides, choosing a good dimensionality reduction method is important when applying machine learning on microbiome data. Just as crucial as making these analyses available to the entire scientific community, so that large-scale studies can be done.La enfermedad inflamatoria intestinal engloba una serie de desórdenes con síntomas muy similares. Por ello, saber qué bacterias están presentes en la microbiota de los pacientes con este tipo de trastornos es útil para su diagnóstico y tratamiento. Para poder estudiar la relación subyacente de los microorganismos que habitan en la microbiota con el fenotipo de la enfermedad se han utilizado técnicas de machine learning. Es crucial un buen estudio de los diferentes algoritmos de clasificación disponibles para poder aplicar aquellos óptimos al descubrimiento de marcadores específicos de la enfermedad o, en última instancia, al diagnóstico clínico. En este trabajo se ha analizado la diversidad microbiana de muestras de biopsia de pacientes sanos, con enfermedad de Crohn o colitis ulcerosa usando el software QIIME 2TM. A partir de los datos de abundancia relativa bacteriana se han aplicado diversas metodologías de aprendizaje supervisado para la clasificación de las muestras. Finalmente, se ha desarrollado una aplicación web interactiva para adaptar los modelos óptimos a los datos de entrada del usuario. Aunque hay modelos lineales que muestran un rendimiento parecido a otros más complejos, el modelo que mayor capacidad predictiva tiene es random forest. Por otra parte, la elección de un buen método de reducción de la dimensionalidad es muy importante a la hora de aplicar machine learning sobre datos de microbioma. Al igual que es crucial facilitar la disponibilidad de estos análisis a toda la comunidad científica, que permitan hacer estudios a mayor escala.La malaltia inflamatòria intestinal engloba una sèrie de desordres amb símptomes molt similars. Per això, saber què bacteris estan presents en la microbiota dels pacients amb aquest tipus de trastorns és útil per al seu diagnòstic i tractament. Per poder estudiar la relació subjacent dels microorganismes que habiten a la microbiota amb el fenotip de la malaltia s'han utilitzat tècniques de machine learning. És crucial un bon estudi dels diferents algoritmes de classificació disponibles per poder aplicar aquells òptims a la descoberta de marcadors específics de la malaltia o, en última instància, a el diagnòstic clínic. En aquest treball s'ha analitzat la diversitat microbiana de mostres de biòpsia de pacients sans, amb malaltia de Crohn o colitis ulcerosa usant el programari QIIME 2Tm. A partir de les dades d'abundància relativa bacteriana s'han aplicat diverses metodologies d'aprenentatge supervisat per a la classificació de les mostres. Finalment, s'ha desenvolupat una aplicació web interactiva per adaptar els models òptims a les dades d'entrada de l'usuari. Encara que hi ha models lineals que mostren un rendiment semblant a altres més complexos, el model que més capacitat predictiva té és random forest. D'altra banda, l'elecció d'un bon mètode de reducció de la dimensionalitat és molt important a l'hora d'aplicar machine learning sobre dades de microbioma. A l'igual que és crucial facilitar la disponibilitat d'aquestes anàlisis a tota la comunitat científica, que permetin fer estudis a major escala.Universitat Oberta de Catalunya (UOC)Canovas Izquierdo, Javier LuisMaceira, MarcAdsuar Gómez, Antonio Jesús202020202020info:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/10609/121346reponame:O2, repositorio institucional de la UOCinstname:Universitat Oberta de Catalunya (UOC)EspañolCC BY-NC-NDhttp://creativecommons.org/licenses/by-nc-nd/3.0/es/info:eu-repo/semantics/openAccessoai:openaccess.uoc.edu:10609/1213462026-05-28T12:42:01Z |
| score |
15.300724 |