exTRAE : clasificación de tuits dirigidos a la RAE mediante las herramientas de modelado de tópicos LSA y LDA

RESUMEN: Este trabajo pretende ofrecer un método informático que clasifique los tuits recibidos por la Real Academia Española (RAE) en su cuenta de Twitter @RAEinforma. Dada la enorme cantidad de tuits que muestran sus dudas sobre cuestiones lingüísticas, es necesario implementar métodos informático...

Descripción completa

Detalles Bibliográficos
Autores: Hernández de la Cruz, Jose María, Saiz Escobar, Bárbara
Tipo de recurso: tesis de maestría
Fecha de publicación:2021
País:España
Institución:Universidad Complutense de Madrid (UCM)
Repositorio:Docta Complutense
Idioma:español
OAI Identifier:oai:docta.ucm.es:20.500.14352/118425
Acceso en línea:https://hdl.handle.net/20.500.14352/118425
Access Level:acceso abierto
Palabra clave:81'322
004.8
Comunicación institucional
LDA
LSA
Real Academia Española
«Topic modeling»
Twitter
Institutional communication
Royal Spanish Academy
Topic modeling
Lingüística
Informática (Filología)
Inteligencia artificial (Informática)
57 Lingüística
5701.04 Lingüística Informatizada
1203.04 Inteligencia Artificial
Descripción
Sumario:RESUMEN: Este trabajo pretende ofrecer un método informático que clasifique los tuits recibidos por la Real Academia Española (RAE) en su cuenta de Twitter @RAEinforma. Dada la enorme cantidad de tuits que muestran sus dudas sobre cuestiones lingüísticas, es necesario implementar métodos informáticos que ayuden al manejo de tales datos. A lo largo de este trabajo, trataremos de vislumbrar cuál es la actual situación de las instituciones en el ámbito digital y pondremos especialmente el foco en la RAE y su labor en Twitter. Luego, explicaremos «topic modeling» y dos de sus métodos: Latent Semantic Allocation y Latent Dirichlet Allocation. Ambos serán empleados para la clasificación de un corpus de más de nueve mil tuits. Concluiremos llevando a cabo un «test» con el que comprobar el éxito de los resultados.