Sistemas de traducción automática neuronal y modelos de lenguaje masivo: un estudio comparativo en traducción sanitaria

La traducción e interpretación en los servicios públicos (TISP) surge en consecuencia del incremento en población extranjera durante las últimas décadas, que hoy se acerca a los 9 millones de personas (Instituto Nacional de Estadística, 2024). Sin embargo, muchos de los nuevos inmigrantes todavía no...

Descripción completa

Detalles Bibliográficos
Autor: Fuentes Ballesteros, Enrique
Tipo de recurso: tesis de maestría
Fecha de publicación:2024
País:España
Institución:Universidad de Alcalá (UAH)
Repositorio:e_Buah Biblioteca Digital Universidad de Alcalá
Idioma:español
OAI Identifier:oai:ebuah.uah.es:10017/64982
Acceso en línea:http://hdl.handle.net/10017/64982
Access Level:acceso abierto
Palabra clave:Traducción
Lingüística
Análisis materiales traducidos
Estudios comparativos
T&I en ámbito sanitario
Translation
Linguistics
Analysis of translated materials
Comparative studies
T&I in healthcare
Philology
Descripción
Sumario:La traducción e interpretación en los servicios públicos (TISP) surge en consecuencia del incremento en población extranjera durante las últimas décadas, que hoy se acerca a los 9 millones de personas (Instituto Nacional de Estadística, 2024). Sin embargo, muchos de los nuevos inmigrantes todavía no hablan el español u otras lenguas cooficiales, dificultando su acceso a los servicios público. En este sentido, es esencial integrar a estas poblaciones mediante un acceso plurilingüe. El objetivo de esta investigación es analizar la calidad de los sistemas de traducción automática genéricos en la combinación ES>EN mediante un estudio de errores en textos médicos, así como los más recientes modelos de lenguaje masivo (LLM, Large Language Models, en inglés). Las herramientas de traducción automática y modelo de lenguaje masivo elegidas son DeepL, Google Translate y ChatGPT, respectivamente. Asimismo, los textos seleccionados para este estudio proceden del Servicio de Salud de Castilla-La Mancha, más concretamente de los hospitales de Albacete y Ciudad Real. Para su estudio se usará la clasificación manual de errores diseñada por Ortiz Boix (2016), que toma como punto de partida la de MQM. Este trabajo se propone realizar un estudio exploratorio sobre la calidad de la traducción automática y modelos de lenguaje masivo aplicado al contexto sanitario. Debido a que el corpus es muy limitado y la clasificación manual se basan en la mera opinión del autor, este trabajo no puede considerarse completamente objetivo, representativo ni universal. Asimismo, este análisis solo puede demostrar una tendencia en relación con los textos usados y su contexto, por lo que, si se usan otros textos, lo más probable es que los resultados varíen a los obtenidos en este trabajo. El análisis de errores aquí llevado a cabo ha señalado la baja calidad de los sistemas de traducción con textos médicos, los cuales precisan de una tarea de posedición para que sean publicables. Sin embargo, cabe reconocer que, a pesar de la cantidad de errores, la calidad de las traducciones es en general buena. En relación con los mejores o peores sistemas de traducción, los resultados no son conclusivos, pues estos varían en función de cómo se analicen los datos