RansomMetrics. Desarrollo de una herramienta de WebScraping de grupos Ransomware en la red TOR y creación de un portal de estadísticas de ciberseguridad
Este proyecto consiste en el desarrollo de una plataforma automatizada para la recopilación, almacenamiento y análisis de datos procedentes de dominios onion en la red TOR pertenecientes a grupos de ransomware. El objetivo principal es monitorizar y estudiar la actividad de estos grupos en sus sitio...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2026 |
| País: | España |
| Institución: | Universidad de Valladolid |
| Repositorio: | UVaDOC. Repositorio Documental de la Universidad de Valladolid |
| OAI Identifier: | oai:dnet:uvadoc______::68df54f2c41fa1b9f754b6a1a446127c |
| Acceso en línea: | https://uvadoc.uva.es/handle/10324/84846 |
| Access Level: | acceso abierto |
| Palabra clave: | Apache Airflow Big Data MongoDB Docker Docker Compose |
| Sumario: | Este proyecto consiste en el desarrollo de una plataforma automatizada para la recopilación, almacenamiento y análisis de datos procedentes de dominios onion en la red TOR pertenecientes a grupos de ransomware. El objetivo principal es monitorizar y estudiar la actividad de estos grupos en sus sitios de filtración de datos, donde publican información sobre las víctimas de sus ataques. El proceso ETL consiste en la obtención de los datos mediante scripts de web scraping en Python que acceden a los sitios de los distintos grupos en la dark web para recolectar información sobre ataques de ransomware realizados. La información obtenida se almacena en el DataWarehouse para su consulta desde el backend de la aplicación web y su presentación al usuario en un portal web que permite a los usuarios consultar y analizar los datos mediante visualizaciones interactivas. Para el web scraping se han utilizado los módulos Selenium y BeautifulSoup de Python junto a un proxy Tor, MongoDB para el almacenamiento de datos y Flask, Jinja y Plotly para la creación del portal web. Todo el sistema ha sido encapsulado en contenedores utilizando Docker Compose, lo que facilita su despliegue y portabilidad y se ha orquestado el flujo de trabajo mediante Apache Airflow permitiendo una recolección de datos periódica. El resultado es una solución robusta, modular y escalable que contribuye a la monitorización del ecosistema del ransomware. |
|---|