Detección temprana de riesgos de salud a partir de minería de textos en Redes Sociales

La anorexia y los desordenes de la alimentación relacionados son un problema de salud pública con unos altos costes en términos de sufrimiento y de gasto sanitario. Esta condición es especialmente prevalente entre las mujeres jóvenes y adolescentes de países desarrollados. Este sector demográfico ti...

Descripción completa

Detalles Bibliográficos
Autor: Moñux Salvador, Samuel
Tipo de recurso: tesis de maestría
Fecha de publicación:2022
País:España
Institución:Universidad Nacional de Educación a Distancia
Repositorio:e-spacio. Repositorio Institucional de la UNED
Idioma:español
OAI Identifier:oai:e-spacio.uned.es:20.500.14468/14236
Acceso en línea:https://hdl.handle.net/20.500.14468/14236
Access Level:acceso abierto
Palabra clave:1203.04 Inteligencia artificial
Descripción
Sumario:La anorexia y los desordenes de la alimentación relacionados son un problema de salud pública con unos altos costes en términos de sufrimiento y de gasto sanitario. Esta condición es especialmente prevalente entre las mujeres jóvenes y adolescentes de países desarrollados. Este sector demográfico tiene una fuerte presencia en redes sociales, lo que unido al hecho de ser diagnosticable por rasgos conductuales, hace que la tarea de su detección sea una buena candidata para la aplicación de herramientas de rastreo en redes sociales que estén basadas en técnicas de Aprendizaje Automático. Esta es la base bajo la que se desarrollaron las ediciones de 2018 y 2019 del laboratorio CLEF eRisk, en el que una serie de equipos de distintas organizaciones de diferentes nacionalidades compitieron en el desarrollo del algoritmo más preciso y rápido (en términos de su capacidad de detección) sobre un conjunto de datos proporcionado por los organizadores. Los objetivos de este proyecto están relacionados con estas competiciones y con la tarea sobre la que se desarrollaron y comprenden: La selección de los enfoques más prometedores y la elaboración de un estudio del “estado del arte” en aquel momento. El diseño e implementación de un sistema similar a los reseñados, inspirado en las técnicas y metodologías empleadas por los mejores equipos pero que incorpore también características novedosas. La evaluación de la solución desarrollada, en comparación con los algoritmos mejor puntuados pero también en términos de su “interpretabilidad”. Este objetivo, sin ser uno de los enunciados explícitamente en la tarea del laboratorio, resulta crucial para cualquier herramienta que aspire a asistir en la toma de decisiones a los profesionales sanitarios de cualquier campo. Estos profesionales necesitan entender la lógica sobre la que se sustenta la predicción para confiar en ella, por lo que debe ser tenida en cuenta desde el principio. El sistema desarrollado demuestra ser competitivo con las mejores soluciones, situándose “virtualmente” entre la décima posición (de 51) en la métrica considerada más útil para evaluar el rendimiento del sistema (F1 ponderada por la rapidez de detección). Además, permite justificar las decisiones identificando los comentarios de los usuarios que más peso han tenido en la predicción, así cómo “describir” la temática de esos comentarios mediante palabras clave (que pueden estar o no en el texto pero que semánticamente están relacionadas con el contenido del mismo).