SciELO - Scientific Electronic Library Online

 
vol.20 número2Características clínicas de pacientes en edad pediátrica con infección por SARS-CoV-2. Cienfuegos, 2020-2021HistoBCAD: herramienta de código abierto para detección de cáncer de mama en imágenes histopatológicas índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


MediSur

versión On-line ISSN 1727-897X

Resumen

PIRCHIO, Rosana. Clasificación de cáncer de mama con técnicas de análisis de la componente principal-Kernel PCA, algoritmos de máquina de vectores de soporte y regresión logística. Medisur [online]. 2022, vol.20, n.2, pp. 199-209.  Epub 30-Abr-2022. ISSN 1727-897X.

Fundamento:

existen muchas herramientas computacionales para administrar imágenes y conjuntos de datos; reducir la dimensión de estos favorece el manejo de la información.

Objetivo:

reducir la dimensión de un conjunto de datos para un mejor manejo de la información.

Métodos:

se utilizó el conjunto de datos de Breast Cancer Wisconsin (información de biopsias - células nucleares) y la plataforma Python Jupyter. Se implementaron técnicas de análisis de la componente principal (PCA) y Kernel PCA (kPCA) para reducir la dimensión a 2, 4, 6. Se hizo una validación cruzada para seleccionar los mejores hiperparámetros de los algoritmos de máquina de vectores de soporte y regresión logística. La clasificación se realizó con el training test original, training test (PCA y kPCA) y training test (datos transformados de PCA y kPCA). Se analizó la exactitud, precisión, exhaustividad, recuperación y el área bajo la curva.

Resultados:

la PCA con seis componentes explicó la tasa de variación casi en 90 %. Los mejores hiperparámetros hallados para máquina de soporte de vectores: kernel lineal y C = 100, para regresión logística fueron C = 100, Newton-cg solución (solver) e I2. Los mejores resultados de las métricas fueron para PCA 2 y 4(0,99; 0,99; 1; 0,99; 0,99). Para el training set con datos originales fueron 0,96; 0,95; 0,99; 0,97; 0,95. Para regresión logística los mejores resultados fueron para kPCA con seis componentes. Los resultados estadísticos fueron iguales a 1. Para el training set con datos originales, esos valores fueron 0,96; 0,95; 0,99; 0,97; 0.95.

Conclusiones:

los resultados de las métricas mejoraron utilizando PCA y kPCA.

Palabras clave : aprendizaje automático; inteligencia artificial; manejo de datos.

        · resumen en Inglés     · texto en Español     · Español ( pdf )