Detección de malware, métodos estadísticos y machine learning

En un mundo parcialmente digitalizado y donde la mayoría de las acciones cotidianas se ven influenciadas por sistemas informáticos, es necesario conocer los riesgos que pueden suponer los ataques informáticos y la distribución de software malicioso o malware. Este tipo de software, normalmente distr...

Full description

Bibliographic Details
Author: Ruiz Ruiz, Javier
Format: master thesis
Publication Date:2018
Country:España
Institution:Universitat Oberta de Catalunya (UOC)
Repository:O2, repositorio institucional de la UOC
OAI Identifier:oai:openaccess.uoc.edu:10609/89547
Online Access:http://hdl.handle.net/10609/89547
Access Level:Open access
Keyword:aprendizaje automático
malware
seguridad informática
machine learning
computer security
aprenentatge automàtic
programari maliciós
seguretat informàtica
Computer security -- TFM
Seguretat informàtica -- TFM
Seguridad informática -- TFM
Description
Summary:En un mundo parcialmente digitalizado y donde la mayoría de las acciones cotidianas se ven influenciadas por sistemas informáticos, es necesario conocer los riesgos que pueden suponer los ataques informáticos y la distribución de software malicioso o malware. Este tipo de software, normalmente distribuido por grandes grupos o asociaciones de criminales, trata de obtener el beneficio económico a partir de los daños que este pueda producir en su objetivo final. Se trata de una amenaza constante y presente en el día a día que afecta tanto a los usuarios como a las empresas de todo el mundo. Es importante conocer la presencia de estas actividades y poder llevar a cabo un estudio y análisis de ellas. Los análisis que se realizan sobre este tipo de software comúnmente están destinados a conocer si el software es realmente mal intencionado o si en cambio se trata de un software legítimo. Actualmente estas clasificaciones y detecciones se realizan en base a ¿firmas¿ o reglas presentes en los sistemas de antivirus tratando de reconocer los patrones característicos de la amenaza. El problema que presenta este tipo de detecciones es la corta escalabilidad que se aprecia cuando una muestra es modificada lo suficiente para que estas firmas sean incapaces de reconocerla, esto hace que sea necesario el continuo estudio de las muestras de software por parte de los analistas de seguridad. Por lo tanto, este documento intenta proponer una solución que facilite el reconocimiento del software malicioso y reduzca el trabajo manual, así como la escalabilidad del sistema utilizando técnicas de machine learning.