Endo-Mining: herramienta web para la búsqueda automatizada de genes potencialmente relacionados con la endometriosis a través de minería de textos

La finalidad de este trabajo es probar que se puede crear una herramienta automatizada de minería de textos biomédicos de la base de datos PubMed y de análisis de los resultados usando el lenguaje R, utilizándola para recuperar un listado de genes posiblemente relacionados con la endometriosis. La h...

Descripción completa

Detalles Bibliográficos
Autor: Vallejo Ortega, Jorge
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/133006
Acceso en línea:http://hdl.handle.net/10609/133006
Access Level:acceso abierto
Palabra clave:endometriosis
minería de datos
shiny
endometriosi
mineria de datos
text mining
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descripción
Sumario:La finalidad de este trabajo es probar que se puede crear una herramienta automatizada de minería de textos biomédicos de la base de datos PubMed y de análisis de los resultados usando el lenguaje R, utilizándola para recuperar un listado de genes posiblemente relacionados con la endometriosis. La herramienta creada resultante del trabajo es un prototipo para un uso casual y exploratorio por parte de investigadores, sin necesidad de que tengan conocimientos de programación ni de otras herramientas bioinformáticas. En este trabajo se ha usado la API base de datos PubMed para la recopilación de datos (sumarios de publicaciones biomédicas) a través de easyPubMed, el reconocimiento de entidades nombradas (un método de minería de textos) a través de pubmed.mineR para obtener una lista de genes a partir de los datos recopilados, la API de la herramienta web Enrichr (a través de enrichR) para ejecutar el test estadístico de enriquecimiento de términos sobre el listado de genes y, finalmente el paquete shiny para programar una aplicación web en lenguaje R de programación. Como resultados se han obtenido un script en lenguaje R y una aplicación web capaces de realizar tareas de minería y análisis de datos de forma programática, un listado de genes potencialmente relacionados con la endometriosis significativamente enriquecidos en términos de ontología génica compatibles con la endometriosis. Llegamos a la conclusión de que es posible implementar diferentes tareas de minería de textos y análisis de datos en un programa escrito en lenguaje R, y obtener resultados de análisis coherentes.