Implementación de modelos de Data Stream sobre plataformas Big Data
En la actualidad existen cada vez más dispositivos conectados a la red que están generando datos continuamente en tiempo real. Tradicionalmente, se han utilizado técnicas que analizan esta información obteniendo los datos de ficheros estáticos almacenados localmente. Esta información también se pued...
| Autor: | |
|---|---|
| Tipo de recurso: | tesis de maestría |
| Fecha de publicación: | 2019 |
| País: | España |
| Institución: | Universidad de Jaén (UJA) |
| Repositorio: | CREA. Colección de recursos educativos abiertos |
| OAI Identifier: | oai:crea.ujaen.es:10953.1/14167 |
| Acceso en línea: | https://hdl.handle.net/10953.1/14167 |
| Access Level: | acceso abierto |
| Palabra clave: | 1203.17 Informática Informática Computer science |
| Sumario: | En la actualidad existen cada vez más dispositivos conectados a la red que están generando datos continuamente en tiempo real. Tradicionalmente, se han utilizado técnicas que analizan esta información obteniendo los datos de ficheros estáticos almacenados localmente. Esta información también se puede analizar utilizando técnicas en modo streaming, que procesan los datos tan pronto como llegan al sistema. Este trabajo se centra en el entorno en streaming. Se incluye una revisión sobre diferentes plataformas de software libre para el procesamiento distribuido, muy utilizadas por la comunidad y en el ámbito de la empresa, junto con dos comparativas de rendimiento. Además, se implementan algunos algoritmos de redes neuronales para streaming basados en ELM (Extreme Learning Machine) sobre la plataforma Spark y se han realizado diferentes comparativas de rendimiento utilizando diferentes datasets reales y sintéticos (generados con MOA). |
|---|