Modelo multiclasificador aplicando minería de datos para el diagnóstico médico utilizando datos abiertos

No Thumbnail Available

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Universidad Santiago de Cali

Abstract

In order to understand, analyze and eventually make use of a massive amount of data, a multidisciplinary approach has been proposed: data mining, it consists in the process of identifying patterns from massive databases. Data mining can be used in several fields: mobile computing, web mining, financial analysis, crime analysis, engineering, management and medicine. In medicine, data mining techniques can be used by researchers for the diagnosis and prediction of sundry diseases. Researchers have widely used several statistical analysis and data mining techniques to improve the accuracy in the diagnosis of the different diseases in medical care. The use of individual data mining techniques reveals an acceptable level of accuracy to determinate the diagnosis of the disease. Sets or combinations of classifiers have produced promising results, improving accuracy, reliability and, most importantly, extensive coverage in many different and practical applications. In this study, we evaluated the application of feature selection methods and the use of a set of three classifiers based on three different mixing strategies using open diabetes and breast cancer databases contained in the ICU data repositorio with the goal of supporting decision-making in medical diagnosis. The effectiveness of the combinations was measured using three commonly accepted metrics, as well as the response times in the construction of the models. Analysis of the results reveal that the sensitivity, specificity and percentage of classification are higher compared to the individual techniques and provides the basis for establishing an improved multi-classifier model.

Description

Para entender, analizar y eventualmente hacer uso de grandes cantidades de datos se ha propuesto un enfoque multidisciplinario, la minería de datos; la cual es el proceso de identificación de patrones a partir de grandes bases de datos. La minería de datos se puede utilizar en varios campos: computación móvil, minería web, análisis financiero, análisis de delitos, ingeniería, gestión y medicina. En el campo de la medicina, las técnicas de minería de datos pueden ser utilizadas por los investigadores para el diagnóstico y predicción de diversas enfermedades. Los investigadores han estado utilizando varias técnicas de análisis estadístico y de minería de datos para mejorar la precisión del diagnóstico de la enfermedad en la atención médica. El uso de técnicas individuales de minería de datos muestra un nivel aceptable de precisión para el diagnóstico de la enfermedad. Los conjuntos o mezclas de clasificadores han producido resultados prometedores, mejorando la precisión, la confianza y, lo más importante, la cobertura espacial en muchas aplicaciones prácticas. En este estudio, se evalúa la aplicación de métodos de selección de características y el uso de un conjunto de tres clasificadores basados en tres estrategias diferentes de mezcla tomando bases de datos abiertas de diabetes y cáncer de mama contenidos en el repositorio de datos de la UCI con el propósito de dar soporte a la toma de decisiones en el diagnóstico médico. Se midió la efectividad de las mezclas utilizando tres métricas comúnmente aceptadas, así como los tiempos de respuesta en la construcción de los modelos. El análisis de los resultados muestra que la sensibilidad, especificidad y porcentaje de clasificación son mayores en comparación con las técnicas individuales y proporcionan la base para establecer un modelo multiclasificador mejorado.

Keywords

Minería de Datos, Descubrimiento de Conocimiento, Aprendizaje Automático, Diagnóstico, Clasificación, Mezcla de Clasificadores, Selección de Características

Citation

Bolaños Ramírez, H. F. (2019). Modelo multiclasificador aplicando minería de datos para el diagnóstico médico utilizando datos abiertos. Universidad Santiago de Cali.