Métodos de clasificación en minería de datos meteorológicos.

Uno de los objetivos de la minería de datos es la clasificación, la cual tiene como fin clasificar una variable dentro de una de las categorías de una clase. En este trabajo se consideraron variables meteorológicas de la estación cumandá. con el objetivo de determinar el modelo adecuado al conjunto...

Descripción completa

Detalles Bibliográficos
Autores: Haro Rivera, Silvia, Zúñiga Lema, Lourdes, Vera Rojas, Luis, Meneses Freire, Antonio, Escudero Villa, Amalia
Tipo de recurso: artículo
Estado:Versión publicada
Fecha de publicación:2018
País:Ecuador
Institución:Escuela Superior Politécnica de Chimborazo
Repositorio:Repositorio Escuela Superior Politécnica de Chimborazo
Idioma:español
OAI Identifier:oai:dspace.espoch.edu.ec:123456789/9395
Acceso en línea:http://dspace.espoch.edu.ec/handle/123456789/9395
Access Level:acceso abierto
Palabra clave:MÉTODOS DE CLASIFICACIÓN
MINERÍA DE DATOS
DATOS METEOROLÓGICOS
CLASSIFICATION METHODS
DATA MINING
METEOROLOGICAL DATA
Descripción
Sumario:Uno de los objetivos de la minería de datos es la clasificación, la cual tiene como fin clasificar una variable dentro de una de las categorías de una clase. En este trabajo se consideraron variables meteorológicas de la estación cumandá. con el objetivo de determinar el modelo adecuado al conjunto de datos, se aplicaron los modelos de clasificación : Naive Bayes, CN2 Rule Induction , K-NN, Tree y Random Forest; así como también los métodos que modifican los parámetros asociados al clasificador: Cross validation, Random sampling , leave one out y test on train data . mediante el software orange canvas se calcularon las medidas de rendimiento, classification Accuary , Precisión Global y Sensibilidad . Se concluyó que los clasificadores naive bayes , cn 2 rule induction y K-nn presentaron valores superiores al 75% de instancias correcta- mente clasificadas. El árbol de decisión y el Bosque Aleatorio superaron el 80%. En cuanto a los métodos que permiten modificar los parámetros asociados al clasificador se determinó que Validación Cruzada, presentó mejores resultados en todas las aplicaciones. La mayor precisión se alcanza en el clasificador bosque aleatorio, con un 83.9% aplicando validación cruzada, seguido por el muestreo aleatorio simple con un porcentaje del 83.1% de verdaderos positivos entre los casos clasificados como positivos.