Uma análise comparativa de ambientes para Big Data: Apche Spark e HPAT

Carvalho, Rafael Aquino de

Uma análise comparativa de ambientes para Big Data: Apche Spark e HPAT

Este trabalho compara o desempenho e a estabilidade de dois arcabouços para o processamento de Big Data: Apache Spark e High Performance Analytics Toolkit (HPAT). A comparação foi realizada usando duas aplicações: soma dos elementos de um vetor unidimensional e o algoritmo de clusterização K-means....

Descripción completa

Detalles Bibliográficos
Autor:	Carvalho, Rafael Aquino de
Tipo de recurso:	tesis de maestría
Estado:	Versión publicada
Fecha de publicación:	2018
País:	Brasil
Institución:	Universidade de São Paulo (USP)
Repositorio:	Biblioteca Digital de Teses e Dissertações da USP
Idioma:	portugués
OAI Identifier:	oai:teses.usp.br:tde-15062018-110116
Acceso en línea:	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-15062018-110116/
Access Level:	acceso abierto
Palabra clave:	Apache Spark Apache Spark. Arcabouços de Big Data Big data frameworks Comparação de desempenho HPAT Performance comparison

Descripción
Sumario:	Este trabalho compara o desempenho e a estabilidade de dois arcabouços para o processamento de Big Data: Apache Spark e High Performance Analytics Toolkit (HPAT). A comparação foi realizada usando duas aplicações: soma dos elementos de um vetor unidimensional e o algoritmo de clusterização K-means. Os experimentos foram realizados em ambiente distribuído e com memória compartilhada com diferentes quantidades e configurações de máquinas virtuais. Analisando os resultados foi possível concluir que o HPAT tem um melhor desempenho em relação ao Apache Spark nos nossos casos de estudo. Também realizamos uma análise dos dois arcabouços com a presença de falhas.

Uma análise comparativa de ambientes para Big Data: Apche Spark e HPAT

Similares en LA Referencia