Despliegue de un entorno de computación cloud para el experimento CMS

RESUMEN: El experimento CMS (Compact Muon Selenoid) está diseñado para descubrir un rango amplio de partículas y fenómenos que se producen en el Gran Colisionador de Hadrones (LHC). Dentro de este proyecto se realizan análisis de grandes volúmenes de datos sobre diferentes infraestructuras distribui...

Descripción completa

Detalles Bibliográficos
Autor: Palacio Hoz, Aida
Tipo de recurso: tesis de maestría
Fecha de publicación:2018
País:España
Institución:Universidad de Cantabria (UC)
Repositorio:UCrea Repositorio Abierto de la Universidad de Cantabria
Idioma:español
OAI Identifier:oai:repositorio.unican.es:10902/13842
Acceso en línea:http://hdl.handle.net/10902/13842
Access Level:acceso abierto
Palabra clave:CMS
Cloud computing
IFCA
Clúster
INDIGO-DataCloud
OpenStack
Orquestación
Contenedor
TOSCA
Heat
Orchestration
Container
Descripción
Sumario:RESUMEN: El experimento CMS (Compact Muon Selenoid) está diseñado para descubrir un rango amplio de partículas y fenómenos que se producen en el Gran Colisionador de Hadrones (LHC). Dentro de este proyecto se realizan análisis de grandes volúmenes de datos sobre diferentes infraestructuras distribuidas de forma global en todo el mundo. Actualmente, el Instituto de Física de Cantabria (IFCA) participa activamente en este proyecto ofreciendo sus recursos de computación. Por un lado, la infraestructura Grid computing dónde sus usuarios, así como otros usuarios del proyecto CMS, ejecutan sus simulaciones. Y por otro lado, los recursos locales, como HPC o clústeres locales, dónde grupos de investigación nacionales o internacionales, así como usuarios CMS, ejecutan sus análisis. En los últimos años, los usuarios CMS del IFCA han tendido a ejecutar sus trabajos utilizando otras vías además de la que la infraestructura local les proporciona. Esto suele ser debido a colaboraciones con investigadores que están acostumbrados a trabajar en otros sistemas. En este trabajo se propone llevar a cabo la implementación y despliegue de un entorno de computación bajo demanda para el experimento CMS sobre una infraestructura cloud basada en OpenStack. Este despliegue se llevará a cabo utilizando la solución desarrollada dentro del proyecto europeo INDIGO-DataCloud, llamada DODAS, que consiste en la orquestación de un clúster de computación basado en contenedores y a su vez integrado en la infraestructura de computación global de CMS, HTCondor. El objetivo que se persigue es ofrecer un servicio que sea transparente y facilite a los usuarios el uso de la infraestructura local y así, explotar nuestros recursos de manera más eficiente que la utilizada hasta ahora. DODAS implica la utilización de diferentes componentes y tecnologías que es necesario integrar para lograr el objetivo final del proyecto. En primer lugar, se hace uso del estándar abierto TOSCA como lenguaje para definir la topología necesaria para desplegar la aplicación. Ha sido necesario realizar algunas modificaciones de forma que sea posible utilizar la topología descrita en la infraestructura local. En segundo lugar, se integran diferentes tecnologías y servicios cloud. El componente principal es el servicio de orquestación de OpenStack, llamado Heat, el cuál es el encargado de manejar todo el ciclo de vida de la infraestructura: desde el despliegue inicial, al escalado de los nodos y finalización del entorno. Como paso final, una vez desplegado el entorno, éste se ha incluido dentro de la Global Pool de HTCondor para que esta nueva infraestructura pueda ser utilizada por los usuarios de CMS y puedan ejecutar sus simulaciones y análisis sobre ella.