Implementación de modelos de Data Stream sobre plataformas Big Data

En la actualidad existen cada vez más dispositivos conectados a la red que están generando datos continuamente en tiempo real. Tradicionalmente, se han utilizado técnicas que analizan esta información obteniendo los datos de ficheros estáticos almacenados localmente. Esta información también se pued...

Descripción completa

Detalles Bibliográficos
Autor: Puentes Marchal, Fernando
Tipo de recurso: tesis de maestría
Fecha de publicación:2019
País:España
Institución:Universidad de Jaén (UJA)
Repositorio:CREA. Colección de recursos educativos abiertos
OAI Identifier:oai:crea.ujaen.es:10953.1/14167
Acceso en línea:https://hdl.handle.net/10953.1/14167
Access Level:acceso abierto
Palabra clave:1203.17 Informática
Informática
Computer science
Descripción
Sumario:En la actualidad existen cada vez más dispositivos conectados a la red que están generando datos continuamente en tiempo real. Tradicionalmente, se han utilizado técnicas que analizan esta información obteniendo los datos de ficheros estáticos almacenados localmente. Esta información también se puede analizar utilizando técnicas en modo streaming, que procesan los datos tan pronto como llegan al sistema. Este trabajo se centra en el entorno en streaming. Se incluye una revisión sobre diferentes plataformas de software libre para el procesamiento distribuido, muy utilizadas por la comunidad y en el ámbito de la empresa, junto con dos comparativas de rendimiento. Además, se implementan algunos algoritmos de redes neuronales para streaming basados en ELM (Extreme Learning Machine) sobre la plataforma Spark y se han realizado diferentes comparativas de rendimiento utilizando diferentes datasets reales y sintéticos (generados con MOA).