Toolkit for privacy evaluation of geolocated data
El auge de los sistemas de geolocalización de los últimos años ha venido acompañado de una nueva problemática, la privacidad de los datos de los usuarios que usan estos sistemas. Este Trabajo de Fin de Máster (TFM) se propone evaluar la privacidad de los datos obtenidos al sanitizar un dataset de pu...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2018 |
| País: | España |
| Institución: | Universitat Oberta de Catalunya (UOC) |
| Repositorio: | O2, repositorio institucional de la UOC |
| OAI Identifier: | oai:openaccess.uoc.edu:10609/89205 |
| Acceso en línea: | http://hdl.handle.net/10609/89205 |
| Access Level: | acceso abierto |
| Palabra clave: | privacidad geolocalización sanitización privacy geolocation sanitization higenització geolocalització privacitat Data protection -- TFM Protecció de dades -- TFM Protección de datos -- TFM |
| Sumario: | El auge de los sistemas de geolocalización de los últimos años ha venido acompañado de una nueva problemática, la privacidad de los datos de los usuarios que usan estos sistemas. Este Trabajo de Fin de Máster (TFM) se propone evaluar la privacidad de los datos obtenidos al sanitizar un dataset de puntos espacio-temporales mediante una serie de métodos de sanitización. Para evaluar la privacidad de un dataset geolocalizado, se evalúa cuán difícil para un atacante sería deducir información sensible para un sujeto cuya información se encuentre en el dataset, ya sea mediante la deducción de puntos de interés (POIs) o mediante la reidentificación de un sujeto mediante el linkado de trazas. Se han evaluado la perturbación, la agregación y el swapping o intercambio como métodos de sanitización. Con tal de evaluarlos, se han atacado los datasets sanitizados mediante los ataques de deducción de hogares, de extracción de stays y de extracción de localizaciones inicio-fin (begin-end). Los resultados deben ser tenidos en cuenta desde el punto de vista de la aplicación que se le dará a los datos sanitizados. Si se desea mantener todos los datos agregados intactos y usar el dataset sanitizado para los mismos propósitos que el dataset original, el método swapping es el más potente manteniendo un buen nivel de privacidad. Si la utilidad del dataset sanitizado no tiene en cuenta que los datos extraídos mantengan los datos agregados ni que se pueda usar para, por ejemplo, crear mapas de movilidad -un escenario poco realista-, la perturbación es un método muy sencillo de implementar que sería suficiente, aunque si no se combinan distintos tipos de perturbación, un atacante podría fácilmente deducir las localizaciones originales. |
|---|