Automatización de la actualización de una base de datos de proteínas moonlighting y análisis de patrones emergentes

El descubrimiento relativamente reciente de las proteínas "moonlighting" o multitarea, capaces de realizar más de una función mediante la misma cadena polipeptídica dependiendo de ciertas condiciones, ha difuminado la relación simple y unidireccional entre los genes y las funciones a travé...

Descripción completa

Detalles Bibliográficos
Autor: Sánchez Lacalle, Daniel
Tipo de recurso: tesis de maestría
Fecha de publicación:2022
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/146512
Acceso en línea:http://hdl.handle.net/10609/146512
Access Level:acceso abierto
Palabra clave:proteínas moonlighting
Python
bases de datos
bases de dades
proteïnes moonlighting
database
protein moonlighting
Bioinformatics -- TFM
Bioinformàtica -- TFM
Bioinformática -- TFM
Descripción
Sumario:El descubrimiento relativamente reciente de las proteínas "moonlighting" o multitarea, capaces de realizar más de una función mediante la misma cadena polipeptídica dependiendo de ciertas condiciones, ha difuminado la relación simple y unidireccional entre los genes y las funciones a través de las proteínas. Las proteínas "moonlighting" representan tanto una oportunidad como un problema debido a la complejidad de discernir donde pueden estar presentes y realizando qué funciones, y como puede afectar la interacción con otros elementos, como medicamentos. Todavía no se conocen bien las características definitorias de una proteína "moonlighting", y cada vez crece la cantidad de funciones no canónicas identificadas, creando la necesidad de mantener bases de datos para estudiar si presentan características particulares además de facilitar el acceso a la información desde un mismo punto. En este trabajo se ha hecho uso de Python para escribir una aplicación capaz de descargar la información de una lista de proteínas de forma recurrente y organizarla de forma que se pueda actualizar la base de datos MultiTaskProtDB. La actualización resultará en la base de datos dedicada a las proteínas "moonlighting" publicada más grande y la aplicación facilitará su actualización periódica. Además, se ha descrito que los términos GO y la localización tienen una distribución acorde con lo esperado en la literatura.