Toolkit for privacy evaluation of geolocated data

El auge de los sistemas de geolocalización de los últimos años ha venido acompañado de una nueva problemática, la privacidad de los datos de los usuarios que usan estos sistemas. Este Trabajo de Fin de Máster (TFM) se propone evaluar la privacidad de los datos obtenidos al sanitizar un dataset de pu...

Descripción completa

Detalles Bibliográficos
Autor: Gil García, Manel
Tipo de recurso: tesis de maestría
Fecha de publicación:2018
País:España
Institución:Universitat Oberta de Catalunya (UOC)
Repositorio:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/89205
Acceso en línea:http://hdl.handle.net/10609/89205
Access Level:acceso abierto
Palabra clave:privacidad
geolocalización
sanitización
privacy
geolocation
sanitization
higenització
geolocalització
privacitat
Data protection -- TFM
Protecció de dades -- TFM
Protección de datos -- TFM
Descripción
Sumario:El auge de los sistemas de geolocalización de los últimos años ha venido acompañado de una nueva problemática, la privacidad de los datos de los usuarios que usan estos sistemas. Este Trabajo de Fin de Máster (TFM) se propone evaluar la privacidad de los datos obtenidos al sanitizar un dataset de puntos espacio-temporales mediante una serie de métodos de sanitización. Para evaluar la privacidad de un dataset geolocalizado, se evalúa cuán difícil para un atacante sería deducir información sensible para un sujeto cuya información se encuentre en el dataset, ya sea mediante la deducción de puntos de interés (POIs) o mediante la reidentificación de un sujeto mediante el linkado de trazas. Se han evaluado la perturbación, la agregación y el swapping o intercambio como métodos de sanitización. Con tal de evaluarlos, se han atacado los datasets sanitizados mediante los ataques de deducción de hogares, de extracción de stays y de extracción de localizaciones inicio-fin (begin-end). Los resultados deben ser tenidos en cuenta desde el punto de vista de la aplicación que se le dará a los datos sanitizados. Si se desea mantener todos los datos agregados intactos y usar el dataset sanitizado para los mismos propósitos que el dataset original, el método swapping es el más potente manteniendo un buen nivel de privacidad. Si la utilidad del dataset sanitizado no tiene en cuenta que los datos extraídos mantengan los datos agregados ni que se pueda usar para, por ejemplo, crear mapas de movilidad -un escenario poco realista-, la perturbación es un método muy sencillo de implementar que sería suficiente, aunque si no se combinan distintos tipos de perturbación, un atacante podría fácilmente deducir las localizaciones originales.