Uma análise comparativa de ambientes para Big Data: Apche Spark e HPAT

Este trabalho compara o desempenho e a estabilidade de dois arcabouços para o processamento de Big Data: Apache Spark e High Performance Analytics Toolkit (HPAT). A comparação foi realizada usando duas aplicações: soma dos elementos de um vetor unidimensional e o algoritmo de clusterização K-means....

Descripción completa

Detalles Bibliográficos
Autor: Carvalho, Rafael Aquino de
Tipo de recurso: tesis de maestría
Estado:Versión publicada
Fecha de publicación:2018
País:Brasil
Institución:Universidade de São Paulo (USP)
Repositorio:Biblioteca Digital de Teses e Dissertações da USP
Idioma:portugués
OAI Identifier:oai:teses.usp.br:tde-15062018-110116
Acceso en línea:http://www.teses.usp.br/teses/disponiveis/45/45134/tde-15062018-110116/
Access Level:acceso abierto
Palabra clave:Apache Spark
Apache Spark.
Arcabouços de Big Data
Big data frameworks
Comparação de desempenho
HPAT
Performance comparison
Descripción
Sumario:Este trabalho compara o desempenho e a estabilidade de dois arcabouços para o processamento de Big Data: Apache Spark e High Performance Analytics Toolkit (HPAT). A comparação foi realizada usando duas aplicações: soma dos elementos de um vetor unidimensional e o algoritmo de clusterização K-means. Os experimentos foram realizados em ambiente distribuído e com memória compartilhada com diferentes quantidades e configurações de máquinas virtuais. Analisando os resultados foi possível concluir que o HPAT tem um melhor desempenho em relação ao Apache Spark nos nossos casos de estudo. Também realizamos uma análise dos dois arcabouços com a presença de falhas.