Bioinformatic Study of Antigen Presentation by HLA class II
Entendre quin és el cribratge al que estan sotmesos els pèptids abans de poder-se unir a les molècules del complex major d’histocompatibilitat classe II o major histocompatibility complex class II en angles (MHC classe II o HLA classe II en humans) per a més tard ser presentats als limfòcits T és es...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Estado: | Versión publicada |
| Fecha de publicación: | 2014 |
| País: | España |
| Recursos: | CBUC, CESCA |
| Repositorio: | TDR. Tesis Doctorales en Red |
| OAI Identifier: | oai:www.tdx.cat:10803/129336 |
| Acesso em linha: | http://hdl.handle.net/10803/129336 |
| Access Level: | acceso abierto |
| Palavra-chave: | HLA Presentation Antigen Ciències Experimentals 57 |
| Resumo: | Entendre quin és el cribratge al que estan sotmesos els pèptids abans de poder-se unir a les molècules del complex major d’histocompatibilitat classe II o major histocompatibility complex class II en angles (MHC classe II o HLA classe II en humans) per a més tard ser presentats als limfòcits T és especialment rellevant per les seves implicacions en salut, a l’estar involucrats en diferents processos relacionats amb la defensa de l’organisme, des de la resposta davant d’infeccions a les reaccions autoimmunitàries, passant pel reconeixement de les cèl·lules cancerígenes. L’objectiu d’aquesta tesi ha estat desenvolupar diferents estratègies usant tècniques bioinformàtiques per a identificar els patrons que reconeixen les diferents molècules del HLA alhora de seleccionar els pèptids que més tard presentaran els diferents al·lels i, per extensió, poder arribar a predir si un determinat pèptid tindrà la capacitat d’unir-se a una determinada molècula d’HLA. Un cop desenvolupat l’algoritme de determinació i predicció de patrons es va construir una plataforma web per poder-hi analitzar grans quantitats de pèptids i/o proteïnes mitjançant diferents funcionalitats. Per a poder assolir aquests objectius, el treball es va dividir en tres fases diferents. La primera fase va consistir en construir una base de dades relacional en postgesql per a poder-hi emmagatzemar tant la informació requerida per al correcte funcionament de l’algoritme com les dades resultants de l’anàlisi d’aquesta informació. La informació requerida per al correcte funcionament de l’algoritme està formada per epítops per als quals es coneix si són o no presentats per les diferents molècules d’HLA classe II i diferents proteomes de patògens humans, així com el proteoma humà. A més a més, s’hi ha inclòs una secció privada on els usuaris registrats poden pujar-hi dades d’epítops derivades de les seves pròpies investigacions per poder-los analitzar en combinació amb les dades públiques del sistema per a una mateixa molècula. En la segona fase d’aquest treball es varen desenvolupar dos predictors, el primer usant un sistema basat en matrius de puntuació específiques de posició (position-specific scoring matrices en anglès, també conegudes com a PSSM) i el segon usant màquines d’aprenentatge de vectors de suport (Suport vector machines en anglès o SVM). Les PSSM varen ser desenvolupades usant un protocol iteratiu d’optimització, on es comença usant la informació proporcionada per l’alineament de segments de 9 residus en epítops, identificats com a possibles regions d’interacció amb les molècules d’HLA objectes de estudi, i posteriorment es va afegint informació tant de pèptids que no s’uneixen a la molècula com del grau de conservació dels diferents al·lels. Per a la construcció de la SVM, els segments d’unió dels pèptids a cada una de les molècules d’HLA es van definir a partir les PSSM construïdes per a cada una d’elles i els paràmetres per a la SVM amb una funció de base radial (Radial-basis function o RBF) com a nucli (kernel) varen ser fixades individualment per a cada cas a fi i efecte d’assolir els millors resultats possibles. En la tercera i última fase d’aquest projecte, es van construir dos pàgines web, una per cada predictor. Aquests predictors tenen en comú que els usuaris en general poden introduir-hi llistats de pèptids i/o proteïnes en format FASTA per a ser analitzades. Aquestes anàlisi tornen com a resultat els possibles motius d’unió detectats i la seva localització en els proteomes seleccionats. Una característica particular del predictor basat en PSSM és que els usuaris registrats poden pujar seqüències resultants de la seva pròpia investigació per trobar nous patrons d’unió a molècules d’HLA noves o millorar els existents i fer prediccions amb ells. |
|---|