exTRAE : clasificación de tuits dirigidos a la RAE mediante las herramientas de modelado de tópicos LSA y LDA
RESUMEN: Este trabajo pretende ofrecer un método informático que clasifique los tuits recibidos por la Real Academia Española (RAE) en su cuenta de Twitter @RAEinforma. Dada la enorme cantidad de tuits que muestran sus dudas sobre cuestiones lingüísticas, es necesario implementar métodos informático...
| Autores: | , |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2021 |
| País: | España |
| Institución: | Universidad Complutense de Madrid (UCM) |
| Repositorio: | Docta Complutense |
| Idioma: | español |
| OAI Identifier: | oai:docta.ucm.es:20.500.14352/118425 |
| Acceso en línea: | https://hdl.handle.net/20.500.14352/118425 |
| Access Level: | acceso abierto |
| Palabra clave: | 81'322 004.8 Comunicación institucional LDA LSA Real Academia Española «Topic modeling» Institutional communication Royal Spanish Academy Topic modeling Lingüística Informática (Filología) Inteligencia artificial (Informática) 57 Lingüística 5701.04 Lingüística Informatizada 1203.04 Inteligencia Artificial |
| Sumario: | RESUMEN: Este trabajo pretende ofrecer un método informático que clasifique los tuits recibidos por la Real Academia Española (RAE) en su cuenta de Twitter @RAEinforma. Dada la enorme cantidad de tuits que muestran sus dudas sobre cuestiones lingüísticas, es necesario implementar métodos informáticos que ayuden al manejo de tales datos. A lo largo de este trabajo, trataremos de vislumbrar cuál es la actual situación de las instituciones en el ámbito digital y pondremos especialmente el foco en la RAE y su labor en Twitter. Luego, explicaremos «topic modeling» y dos de sus métodos: Latent Semantic Allocation y Latent Dirichlet Allocation. Ambos serán empleados para la clasificación de un corpus de más de nueve mil tuits. Concluiremos llevando a cabo un «test» con el que comprobar el éxito de los resultados. |
|---|