RansomMetrics. Desarrollo de una herramienta de WebScraping de grupos Ransomware en la red TOR y creación de un portal de estadísticas de ciberseguridad

Este proyecto consiste en el desarrollo de una plataforma automatizada para la recopilación, almacenamiento y análisis de datos procedentes de dominios onion en la red TOR pertenecientes a grupos de ransomware. El objetivo principal es monitorizar y estudiar la actividad de estos grupos en sus sitio...

Descripción completa

Detalles Bibliográficos
Autor: Estévez Asensio, Javier
Tipo de recurso: tesis de maestría
Fecha de publicación:2026
País:España
Institución:Universidad de Valladolid
Repositorio:UVaDOC. Repositorio Documental de la Universidad de Valladolid
OAI Identifier:oai:dnet:uvadoc______::68df54f2c41fa1b9f754b6a1a446127c
Acceso en línea:https://uvadoc.uva.es/handle/10324/84846
Access Level:acceso abierto
Palabra clave:Apache Airflow
Big Data
MongoDB
Docker
Docker Compose
Descripción
Sumario:Este proyecto consiste en el desarrollo de una plataforma automatizada para la recopilación, almacenamiento y análisis de datos procedentes de dominios onion en la red TOR pertenecientes a grupos de ransomware. El objetivo principal es monitorizar y estudiar la actividad de estos grupos en sus sitios de filtración de datos, donde publican información sobre las víctimas de sus ataques. El proceso ETL consiste en la obtención de los datos mediante scripts de web scraping en Python que acceden a los sitios de los distintos grupos en la dark web para recolectar información sobre ataques de ransomware realizados. La información obtenida se almacena en el DataWarehouse para su consulta desde el backend de la aplicación web y su presentación al usuario en un portal web que permite a los usuarios consultar y analizar los datos mediante visualizaciones interactivas. Para el web scraping se han utilizado los módulos Selenium y BeautifulSoup de Python junto a un proxy Tor, MongoDB para el almacenamiento de datos y Flask, Jinja y Plotly para la creación del portal web. Todo el sistema ha sido encapsulado en contenedores utilizando Docker Compose, lo que facilita su despliegue y portabilidad y se ha orquestado el flujo de trabajo mediante Apache Airflow permitiendo una recolección de datos periódica. El resultado es una solución robusta, modular y escalable que contribuye a la monitorización del ecosistema del ransomware.