Analysis and migration to Scala of the BLAST Algorithm

Los objetivos de este proyecto, tal como se menciona en la introducción, consisten en el análisis y migración de una solución previamente realizada en Python y Cassandra, que actúa como base de datos para las cadenas de ADN, para obtener mayor integración, rendimiento y prestaciones. El objetivo pri...

Descripción completa

Detalles Bibliográficos
Autor: López Luna, Óscar
Tipo de recurso: tesis de maestría
Fecha de publicación:2022
País:España
Institución:Varias* (Consorci de Biblioteques Universitáries de Catalunya, Centre de Serveis Científics i Acadèmics de Catalunya)
Repositorio:Recercat. Dipósit de la Recerca de Catalunya
OAI Identifier:oai:recercat.cat:10459.1/83874
Acceso en línea:http://hdl.handle.net/10459.1/83874
Access Level:acceso abierto
Palabra clave:Spark
Blast
Big Data
Migración
Cassandra
Dades massives
Descripción
Sumario:Los objetivos de este proyecto, tal como se menciona en la introducción, consisten en el análisis y migración de una solución previamente realizada en Python y Cassandra, que actúa como base de datos para las cadenas de ADN, para obtener mayor integración, rendimiento y prestaciones. El objetivo principal será, como se ha comentado en el párrafo superior, la mejora de rendimiento y para ello se realizará una migración a Scala (lenguaje de programación funcional, pionero en el área de Big Data) y se comprobará este hecho llevando a cabo un análisis de la “performance” de ambas soluciones. El rendimiento se verá afectado debido a que la migración supondría poder aprovechar mejor la conexión con Cassandra, ya que nos permite un uso más preciso del conector [8] (estándar de acceso a las bases de datos). En otras palabras, accesos más rápidos debido a la reducción en el tiempo de conexión con la base de datos y sobretodo, en las consultas realizadas. Una vez realizados el análisis y la migración, se proseguirá con una explicación de los resultados en base a los tiempos obtenidos en ambos casos. En conclusión, la migración a Scala, debería aportar una mejora sustancial de rendimiento, prestaciones y productividad debido a que el conector tiene más afinidad con el nuevo lenguaje en el que estará implementado.