Modelo predictivo de enfermedad cardiovascular basado en inteligencia artificial en la atención primaria de salud

Vega Abascal, Jorge Baudilio; Piriz Assa, Alberto Rubén; Nápoles Riaño, Diego; Vega Abascal, Jorge Baudilio; Piriz Assa, Alberto Rubén; Nápoles Riaño, Diego

Meu SciELO

Serviços customizados

Serviços Personalizados

Artigo

Enviar este artigo por email

Indicadores

Citado por SciELO

Links relacionados

Similares em SciELO

Mais
Mais

Permalink

Revista Cubana de Medicina General Integral

versão On-line ISSN 1561-3038

Rev Cubana Med Gen Integr vol.39 no.3 Ciudad de La Habana jul.-set. 2023 Epub 30-Set-2023

Artículo original

Modelo predictivo de enfermedad cardiovascular basado en inteligencia artificial en la atención primaria de salud

A Predictive Model for Cardiovascular Disease based on Artificial Intelligence in Primary Health Care

0000-0001-9038-8499Jorge Baudilio Vega Abascal¹^*, 0000-0002-6261-5807Alberto Rubén Piriz Assa², 0000-0002-8637-1325Diego Nápoles Riaño³

^¹Universidad de Ciencias Médicas Holguín, Policlínico Docente “José Ávila Serrano”. Velasco, Holguín, Cuba.

^²Hospital Pediátrico Provincial “Octavio de la Concepción de la Pedraja”. Holguín, Cuba.

^³Universidad de Ciencias Médicas Holguín. Holguín, Cuba.

RESUMEN

Introducción:

En Cuba y en el resto del mundo, las enfermedades cardiovasculares son reconocidas como un problema de salud pública mayúsculo y creciente, que provoca una alta mortalidad.

Objetivo:

Diseñar un modelo predictivo para estimar el riesgo de enfermedad cardiovascular basado en técnicas de inteligencia artificial.

Métodos:

La fuente de datos fue una cohorte prospectiva que incluyó 1633 pacientes, seguidos durante 10 años, fue utilizada la herramienta de minería de datos Weka, se emplearon técnicas de selección de atributos para obtener un subconjunto más reducido de variables significativas, para generar los modelos fueron aplicados: el algoritmo de reglas JRip y el meta algoritmo Attribute Selected Classifier, usando como clasificadores el J48 y el Multilayer Perceptron. Se compararon los modelos obtenidos y se aplicaron las métricas más usadas para clases desbalanceadas.

Resultados:

El atributo más significativo fue el antecedente de hipertensión arterial, seguido por el colesterol de lipoproteínas de alta densidad y de baja densidad, la proteína c reactiva de alta sensibilidad y la tensión arterial sistólica, de estos atributos se derivaron todas las reglas de predicción, los algoritmos fueron efectivos para generar el modelo, el mejor desempeño fue con el Multilayer Perceptron, con una tasa de verdaderos positivos del 95,2 % y un área bajo la curva ROC de 0,987 en la validación cruzada.

Conclusiones:

Fue diseñado un modelo predictivo mediante técnicas de inteligencia artificial, lo que constituye un valioso recurso orientado a la prevención de las enfermedades cardiovasculares en la atención primaria de salud.

Palabras-clave: enfermedad cardiovascular; factores de riesgo; modelo predictivo; inteligencia artificial; aprendizaje automático; minería de datos; atención primaria de salud

ABSTRACT

Introduction:

In Cuba and in the rest of the world, cardiovascular diseases are recognized as a major and growing public health problem, which causes high mortality.

Objective:

To design a predictive model to estimate the risk of cardiovascular disease based on artificial intelligence techniques.

Methods:

The data source was a prospective cohort including 1633 patients, followed for 10 years. The data mining tool Weka was used and attribute selection techniques were employed to obtain a smaller subset of significant variables. To generate the models, the rule algorithm JRip and the meta-algorithm Attribute Selected Classifier were applied, using J48 and Multilayer Perceptron as classifiers. The obtained models were compared and the most used metrics for unbalanced classes were applied.

Results:

The most significant attribute was history of arterial hypertension, followed by high and low density lipoprotein cholesterol, high sensitivity c-reactive protein and systolic blood pressure; all the prediction rules were derived from these attributes. The algorithms were effective to generate the model. The best performance was obtained using the Multilayer Perceptron, with a true positive rate of 95.2% and an area under the ROC curve of 0.987 in the cross validation.

Conclusions:

A predictive model was designed using artificial intelligence techniques; it is a valuable resource oriented to the prevention of cardiovascular diseases in primary health care.

Key words: cardiovascular disease; risk factors; predictive model; artificial intelligence; automated learning; data mining; primary health care

Introducción

Las enfermedades cardiovasculares son las enfermedades crónicas no trasmisibles más comunes, responsables de 17,8 millones de muertes a nivel mundial; estas afectan, de manera creciente, a poblaciones en edad laboral y contribuyen desproporcionadamente a la pérdida de años potenciales de vida saludable y de productividad económica, situación que es reconocida como un problema de salud pública mayúsculo y creciente en el mundo y en Cuba.¹^,²

En Cuba, en el año 2020, las enfermedades del corazón, ocuparon el primer lugar dentro de las causas de muerte, con una tasa de 267,3 por 100 000 habitantes, se incrementó también la mortalidad para las enfermedades cerebrovasculares.³

Las tablas de riesgo son métodos simplificados, basados en funciones matemáticas que modelan el riesgo de los individuos de distintas cohortes de poblaciones seguidas, generalmente durante 10 años, en las que se establece un algoritmo matemático que permite obtener el porcentaje de sujetos que pueden desarrollar un evento cardiovascular.⁴

En diferentes países han sido desarrollados varios modelos de riesgo, que usualmente estiman el riesgo para un período de 10 años, usando factores de riesgo convencionales, como Framingham clásica y por categorías, REGICOR para España, SCORE, PROCAM y recientemente las tablas de la OMS para diferentes regiones del mundo, aprobadas para su uso en la población cubana, entre otras.⁵

La limitación más importante de las funciones de riesgo es su baja sensibilidad, de manera que gran parte de los acontecimientos cardiovasculares se presentan en el grupo de la población con riesgo intermedio, otras limitaciones son: necesitan recalibrarse cuando se usan directamente a poblaciones distintas de donde fueron diseñados, consideran un número limitado de factores de riesgo tradicionales o clásicos, sin incluir factores metabólicos y biomarcadores de inflamación, a pesar de que pueden ser un riesgo independiente de complicaciones vasculares, la definición del nivel de riesgo y los puntos de corte es arbitraria y no tienen en cuenta que el riesgo es un continuo, más que un proceso aditivo.¹^,⁴^,⁵^,⁶^,⁷

La obtención de conocimiento en un dominio de aplicación a partir de datos presentes es una práctica muy actual, el aprendizaje automático (Machine Learning, ML) es una subárea de la inteligencia artificial, que tiene como objetivo diseñar algoritmos que realizan el aprendizaje en los datos disponibles, son capaces de procesar grandes cantidades de datos y transformarlos en conocimiento, lo que permite tomar decisiones o acciones inteligentes.⁸^,⁹

Varios estudios muestran que los modelos de predicción cardiovascular diseñados con algoritmos de machine learning exhiben un desempeño superior cuando son comparados con los modelos tradicionales y pueden predecir el riesgo cardiovascular eficazmente.¹⁰^,¹¹^,¹²

Hasta el momento, no se dispone de un modelo de predicción del riesgo de enfermedad cardiovascular en la atención primaria de salud a partir de datos de seguimiento de cohortes de poblaciones cubanas.

El objetivo de la investigación fue diseñar un modelo predictivo para estimar el riesgo de enfermedad cardiovascular basado en técnicas de inteligencia artificial.

Métodos

La población de estudio de 35 a 74 años perteneciente al policlínico docente “José Ávila Serrano”, de Velasco, Holguín, en Cuba.

Los datos utilizados en la investigación provienen de la cohorte del estudio PredRCG_aps, que incluyó 857 pacientes del sexo femenino y 776 del masculino, con edades de 35 a 74 años sin antecedentes de enfermedad cardiovascular a la inclusión, seleccionados aleatoriamente, que fueron seguidos durante 10 ± 1,3 años, desde enero 2008 hasta diciembre de 2019; se realizaron evaluaciones clínicas anuales a cada paciente, la variable resultado fue el desarrollo de un evento cardiovascular mortal o no.¹³

La base de datos incluyó las siguientes variables predictoras: edad, sexo, hábito de fumar, antecedentes personales de diabetes mellitus e hipertensión arterial, índice de masa corporal, circunferencia abdominal, tensión arterial sistólica y diastólica, colesterol total, lipoproteínas de baja densidad colesterol (LDLc), lipoproteínas de alta densidad colesterol (HDLc), triglicéridos, ácido úrico, glicemia en ayunas y proteína c reactiva de alta sensibilidad (pcr-as o pcr-hs, high sensitivity).¹³

Fue utilizada WEKA, un software de código abierto, acrónimo de Waikato Environment for Knowledge Análisis, versión 3.9.5, que implementa machine learning y que tiene como objetivo brindar algoritmos de minería de datos.¹⁴

Cada caso quedó conformado por 16 atributos o rasgos predictores y un rasgo de decisión, Evento, donde se indica si el paciente desarrolló o no el evento cardiovascular, cuyo dominio es {Evento = SI, Evento = NO}, con dos clases de decisión: 1531 pacientes, no desarrollaron el evento cardiovascular y 102 sí.

La etapa Preprocesamiento consistió en la preparación y limpieza, se convierten o discretizan los datos validándolos, para un manejo estandarizado y homogéneo, permitiendo obtener mejores resultados según las características del algoritmo a utilizar, aplicándose filtros supervisados sobre los atributos o las instancias.

Para balancear ambas clases, fue aplicado el algoritmo supervisado dirigido a las instancias, SMOTE (Synthetic Minority Over-sampling TEchnique).¹⁵

Se emplearon técnicas de selección de atributos integradas en Weka para obtener un subconjunto más reducido de variables significativas: CfsSubsetEval, con el método de búsqueda Best First, Wrapper SubsetEval con J48 y Correlation Attribute Eval, con el método Ranker.

Se ejecutaron los siguientes algoritmos de clasificación de Weka: el algoritmo de clasificación de reglas JRip, los meta algoritmos de clasificación Attribute Selected Classifier, usando como algoritmos clasificadores el J48 y el algoritmo de clasificación de funciones Multilayer Perceptron, en ambos usando como evaluador el CfsSubsetEval y como método de búsqueda el BestFirst.

Se compararon los modelos obtenidos y se aplicaron las métricas más usadas para clases desbalanceadas, basadas en la matriz de confusión como: la tasa de verdaderos positivos (TPrate, en inglés) y tasa de falsos positivos (FPrate, en inglés), en la clase de interés, que fue la minoritaria, es decir Evento = SI, el área bajo la Curva de Operación del Receptor (ROC) y la curva Precisión_Recall (PRC).

Al disponer de una sola base de datos, se utilizó el conjunto de datos para entrenamiento y para la validación se utilizó la validación cruzada con 10 particiones (10folds cross -validation).

La investigación, desde el punto de vista ético, cumplió con la Declaración de Helsinki,¹⁶ se protegieron los derechos y confiabilidad de las personas en el estudio, la investigación fue revisada y aprobada por el Comité de Ética de la Investigación Clínica de la institución.

Resultados

Se emplearon técnicas de visualización de información para mostrar la distribución de los rasgos predictores seleccionados entre las 2 clases de decisión, la figura 1 refleja que la proporción fue superior en los pacientes que desarrollaron el evento cardiovascular, fue más marcada la diferencia en el antecedente de hipertensión arterial, las cifras de tensión arterial sistólicas mayor de 140 mmHg, el índice de masa corporal mayor de 30 Kg/m² y de proteína c reactiva de alta sensibilidad (pcr-as) mayor de 3 mg/dl, se consideraron en los rasgos los valores considerados en riesgo o elevados, como las clases muestran un alto desbalance, el porcentaje fue superior en la clase minoritaria, Evento SÍ, que es la clase de interés.

Fig. 1 Proporción de rasgos predictores entre los pacientes que desarrollaron o no el evento cardiovascular.

Al aplicar los métodos de selección, los atributos de mayor significación fueron: edad, hábito de fumar, antecedentes personales de hipertensión arterial, tensión arterial sistólica, circunferencia abdominal, triglicéridos, colesterol lipoproteína de alta y baja densidad, glicemia en ayunas y proteína c reactiva de alta sensibilidad.

La extracción de reglas con el algoritmo JRip se muestran en la tabla 1, se sustituyó el valor de referencia usado en la práctica médica en cada categoría codificada, la reglas se generaron en la base de datos de entrenamiento, la premisa de la regla (antecedente) es una condición que se debe cumplir para que se tenga la decisión que aparece como consecuente; en la clase minoritaria Evento SI, ya balanceada se obtienen indicadores aceptables, con una tasa de verdaderos positivos de 0,959 y un área bajo la curva ROC de 0,977, al final en paréntesis se muestran los aciertos y errores en cada regla.

Tabla 1 Reglas obtenidas con el algoritmo JRip

La figura 2 muestra una fracción del árbol de decisión obtenido con el algoritmo J 48, se seleccionaron los atributos predictores más significativos, para ir creando nodos de forma descendente y recursiva; los nodos más próximos a la raíz son los mejores predictores y, a partir de ellos, el proceso se repite para generar ramas en el árbol con nuevos nodos a partir de los datos restantes, el antecedente de hipertensión arterial (apphta) fue el rasgo más significativo, seguido por el colesterol hdl y el colesterol ldl, la proteína c reactiva (pcr-as) y las cifras de tensión arterial sistólica (tas), a partir de ellos se derivaron todas las reglas de predicción.

Fig. 2 Árbol de decisión (fracción) generado por el meta-algoritmo de clasificación Attribute Selected Classifier junto con el algoritmo J 48.

La arquitectura de la red neuronal se muestra en la figura 3, quedó conformada por las neuronas en la capa de entrada, que corresponden a los rasgos predictores, once neuronas en la capa oculta y dos neuronas en la capa de salida que corresponden a la clase decisión SÍ y NO, en las 500 épocas del proceso (epochs), el error fue disminuyendo de 0,0132428 hasta llegar a 0,0063552, con una tasa de aprendizaje (learning rate) de 0,3 y el momentum de 0,2.

Fig. 3 Arquitectura de la red neuronal con el algoritmo multilayer perceptron.

Los algoritmos clasificadores (tabla 2) nos muestran que son efectivos para generar el modelo predictivo, al comparar las métricas en el test de entrenamiento y validación cruzada, en la clase minoritaria Evento = SI, el mejor desempeño se evidencia con el algoritmo Multilayer Perceptron.

Tabla 2 Evaluación del desempeño de los algoritmos clasificadores en los datos de entrenamiento y de validación cruzada

Discusión

La obtención de conocimiento en un dominio de aplicación a partir de datos presentes se convierte en una práctica muy actual, han sido desarrolladas numerosas técnicas de descubrimiento del conocimiento desde la inteligencia artificial; los términos aprendizaje automático, minería de datos y de textos, nos resultan familiares, el conocimiento generado por ellas puede utilizarse para la construcción de modelos inteligentes y aumentar el conocimiento existente en dominios de aplicación como la predicción del riesgo de enfermedad cardiovascular.¹⁶

Con pocos atributos, los más significativos o los que tienen más peso, se obtiene una mejor clasificación y se evita el sobreajuste (overfitting) del modelo diseñado y que este sea más comprensible, ignorándose los atributos no significativos.¹⁷

Dentro de los modelos de predicción, los arboles de decisión son los más utilizados por una serie de razones que los hacen especialmente atractivos como: la sencillez del modelo, la amplitud de implementaciones que existen, la rapidez de clasificación de nuevos patrones, la posibilidad de representarlos gráficamente aportando así una explicación de la división efectuada, la fácil interpretación, en caso de no ser excesivamente grandes y la posibilidad de obtener las reglas por las cuales asignamos cada una de las probabilidades.¹⁷

Como apreciamos, el mejor desempeño se alcanzó con el modelo predictivo creado por el algoritmo Multilayer Perceptron, en la red neuronal el aprendizaje se produce por medio de la retropropagación, el algoritmo compara el resultado de la capa de salida con el resultado deseado y asume que el error en la unidad de salida se debe a errores en las unidades conectadas con ella, y para corregirse realiza ajustes en los pesos asignados en la red desde la capa de salida hasta la capa de entrada, hacia atrás, de ahí el término de retropropagación.¹⁸^,¹⁹

Una de las limitaciones para la implementación practica de estos sistemas de inteligencia artificial de tanto potencial como los modelos algorítmicos basados en redes neuronales artificiales, es que no hay suficiente comprensión de las reglas que generan, dificultando la interpretación, comportándose como cajas negras (black boxes, en inglés).⁸^,²⁰^,²¹

El aprendizaje automático es parte fundamental en un proceso de análisis predictivo, ya que proporciona las técnicas de análisis de datos mediante las cuales se pueden descubrir relaciones entre variables que en un principio pueden parecer insignificantes, o cuya significación es incierta, pero que tras la aplicación de estas técnicas puede descubrirse la trascendencia de las mismas.²²

La minería de datos es una ciencia experimental, existen una gran cantidad de técnicas de preprocesamiento, así como algoritmos de clasificación, pero no hay un método único, universal y mejor para un problema específico, necesitamos encontrar los métodos de aprendizaje que trabajen mejor ante un determinado problema.⁸^,²³^,²⁴

No encontramos, en la revisión bibliográfica, modelos predictivos sobre riesgo cardiovascular en Cuba basados en la inteligencia artificial, lo que nos limitó hacer comparaciones, el modelo obtenido incorpora predictores noveles como la circunferencia abdominal, los triglicéridos, la glicemia en ayunas y la proteína c reactiva de alta sensibilidad, no contemplados en los modelos tradicionales.

Estos predictores noveles están involucrados en los mecanismos de resistencia a la insulina, inflamación y aterosclerosis, en ocasiones subclínica, muchas veces, el evento cardiovascular es mortal o no, la primera manifestación clínica.

La resistencia a la insulina incluye una variedad de trastornos en el metabolismo de lípidos, como aumento del nivel de triglicéridos plasmáticos y disminución de colesterol de HDL; los trastornos de la glucemia en ayuna, intolerancia a carbohidratos y, por último, la diabetes mellitus tipo 2, asociados a la obesidad, que incluye la abdominal, no siempre considerada por el médico en la atención primaria; la hipertensión arterial, teniendo como base un estado proinflamatorio crónico con niveles elevados de pcr-as relacionados directamente con la magnitud de la resistencia a la insulina.¹³

La inflamación desempeña un papel determinante en el inicio y progresión del proceso aterotrombótico, así como en sus manifestaciones clínicas, la determinación de los niveles de pcr-as determinados mediante un método inmunoturbidimétrico de alta sensibilidad permite detectar la inflamación de bajo grado característica de la aterosclerosis, su estabilidad por largo tiempo durante el almacenamiento, larga vida media y carencia de variación diurna, son factores que han contribuido a que este sea el biomarcador inflamatorio más extensamente evaluado en la actualidad.⁷^,²⁵

Una limitación del estudio fue que no se cuenta con registros informatizados de datos de los pacientes en la atención primaria de salud y por las condiciones logísticas no se pudo disponer de una muestra más amplia de la población, actualmente se implementa el modelo para su aplicación práctica.

Los resultados pueden ayudar a mejorar la predicción de la enfermedad cardiovascular y muestran las capacidades de las técnicas de inteligencia artificial ante la gran cantidad de datos que no puede ser procesada y analizada con métodos tradicionales y nos lleva a hablar de la inteligencia artificial como una nueva forma de generar conocimiento; la medicina y la salud se han convertido en unas de las más prometedoras áreas para la aplicación de los sistemas de inteligencia artificial.²⁶

En conclusión, fue diseñado un modelo predictivo mediante técnicas de inteligencia artificial, lo que constituye un valioso recurso orientado a la prevención de las enfermedades cardiovasculares en la atención primaria de salud.

Aporte científico

Es una de las primeras investigaciones que obtiene un modelo predictivo de riesgo de enfermedad cardiovascular usando técnicas de inteligencia artificial, basado en una cohorte de una población cubana e incorpora predictores noveles relacionados con la patogenia de la aterosclerosis y dota al médico de familia de una herramienta útil para la prevención de la enfermedad cardiovascular en la atención primaria de salud.

Referencias bibliográficas

1. WHO CVD Risk Chart Working Group. World Health Organization cardiovascular disease risk charts: revised models to estimate risk in 21 global regions. Lancet Glob Health. 2019;1-11. DOI:http://dx.doi.org/10.1016/S2214-109X1. (19)30318-3 [ Links ]

2. Vega J, Guimará M, Vega L. Riesgo cardiovascular, una herramienta útil para la prevención de las enfermedades cardiovasculares. Rev Cubana Med Gen Integr. 2011 [acceso 14/01/2020];27(1):91-7. Disponible en: http://scielo.sld.cu/pdf/mgi/v27n1/mgi10111.pdf2. [ Links ]

3. Anuario Estadístico de Salud. MINSAP. Cuba. 2020. Disponible en: http://files.sld.cu/bvscuba/files/2021/08/Anuario-Estadistico-Español-2020-Definitivo.pdf3. [ Links ]

4. Vega J, Guimará MR, Garces Y, Vega LA, Rivas M. Predicción de riesgo coronario y cardiovascular global en la atención primaria de salud. CCM. 2015 [acceso 14/03/2017];19(2):202-11. Disponible en: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1560-43812015000200003&lng=es4. [ Links ]

5. Pizarro R, Masson W. Estudios prospectivos poblacionales: las fortalezas de las cohortes históricas. Acta Gastroenterol Latinoam. 2020 [acceso 24/03/2021];50(4):382-7. Disponible en: https://actagastro.org/estudios-prospectivos-poblacionales-las-fortalezas-de-las-cohortes-historicas/5. [ Links ]

6. Elosua R. Las funciones de riesgo cardiovascular: utilidades y limitaciones. Rev Esp Cardiol. 2014 [acceso 14/01/2015];67(2):77-9. Disponible en: http://www.revespcardiol.org/es/pdf/90267565/S300/6. [ Links ]

7. Shrivastava AK, Singh HV, Raizada A, Singh SK. C-reactive protein, inflammation and coronary heart disease. The Egyptian Heart Journal. 2015;67:89-97. DOI: http://dx.doi.org/10.1016/j.ehj.2014.11.0057. [ Links ]

8. Witten I, Frank E, Hall M. Data Mining: Practical Machine Learning Tools and Techniques. Tercera. San Francisco, California: Morgan Kaufmman, Elsevier; 2011. Disponible en: https://www.academia.edu/23331284/Data_Mining_Practical_Machine_Learning_Tools_and_Techniques_3rd_Edition8. [ Links ]

9. Mazon B, Pinta M, Redovran F. Desarrollo de competencias en Minería de Datos, una experiencia didáctica. En: Sistematización de experiencias educativas innovadoras. Primera Edición. Machala, Ecuador: UTMACH; 2020. p. 460. Disponible en: https://www.researchgate.net/publication/343558044_Desarrollo_de_competencias_en_Mineria_de_Datos_una_experiencia_didactica9. [ Links ]

10. Bannister C, Halcox J, Currie C, Preece A, Spasic I. A genetic programming approach to development of clinical prediction models: A case study in symptomatic cardiovascular disease. PLoS ONE. 2018;13(9):e0202685. DOI:https://doi.org/10.1371/journal10. . pone.0202685 [ Links ]

11. Dimopoulos AC, Nikolaidou M, Caballero F, Engchuan W, Sanchez-Niubo A, Arndt H, et al. Machine learning methodologies versus cardiovascular risk scores, in predicting disease risk. BMC Medical Research Methodology. 2018;18(179):2-11. DOI:https://doi.org/10.1186/s12874-018-0644-111. [ Links ]

12. Kim JO, Jeong YS. Kim JH, Lee JW, Park D, Kim HS. Machine Learning-Based Cardiovascular Disease Prediction Model: A Cohort Study on the Korean National Health Insurance Service Health Screening Database. Diagnostics. 2021 [acceso 14/07/2021];11(943). Disponible en: https://www.researchgate.net/publication/351854383_Machine_Learning-Based_Cardiovascular_Disease_Prediction_Model_A_Cohort_Study_on_the_Korean_National_Health_Insurance_Service_Health_Screening_Database12. [ Links ]

13. Vega J, Piriz A, Guimará M, Vega L, Caballero L, Nápoles D. PredRCG_aps: Predicción del riesgo cardiovascular global en la atención primaria de salud. CCM. 2022 [acceso 14/07/2022];26(2). Disponible en: http://www.revcocmed.sld.cu/index.php/cocmed/article/view/4202/213613. [ Links ]

14. Weka 3.9.5. Disponible en: http://www.cs.waikato.ac.nz/ml/weka/14. [ Links ]

15. Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP. SMOTE: Synthetic Minority Over-sampling TEchnique. Artificial Intelligence Research. 2002 [acceso 14/07/2003];341-78. Disponible en: https://www.jair.org/index.php/jair/article/view/1030215. [ Links ]

16. World Medical Association. World Medical Association Declaration of Helsinki: Ethical Principles for Medical Research Involving Human Subjects. JAMA. 2013 [acceso 14/01/2015];310(20):2191-4. DOI:https://doi.org/10.1001/jama.2013.28105316. [ Links ]

17. García MM, Rodríguez Y, Hernández A, Bello B, Filiberto Y, Rosete A, et al. Adquisición de conocimiento sobre la letalidad de la COVID-19 mediante técnicas de inteligencia artificial. Anales de la Academia de Ciencias de Cuba. 2020 [acceso 14/01/2021];10(3). Disponible en: http://revistaccuba.sld.cu/index.php/revacc/article/view/89117. [ Links ]

18. Arnejo Calviño HA. Métodos para la mejora de predicciones en clases desbalanceadas en el estudio de bajas de clientes (CHURN). La Coruña, España: Universidad de Vigo; 2016 [acceso 24/08/2021]. Disponible en: http://eio.usc.es/pub/mte/descargas/proyectosfinmaster/proyecto_1469.pdf18. [ Links ]

19. Ayala E, López R, Menéndez V. Modelos predictivos de riesgo académico en carreras de computación con minería de datos educativos. RED. 2021;21(26). DOI:https://doi.org/10.6018/red.46356119. [ Links ]

20. Gironés J, Casas J, Minguillón J, Caihuelas R. Minería de datos: modelos y algoritmos. Primera. Barcelona, España: UOC; 2017 [acceso 14/06/2020]. Disponible en: https://dokumen.site/file/mineria-de-datos-modelos-y-algoritmospdf-a5b39f02c4ae1120. [ Links ]

21. Hailesilassie T. Rule Extraction Algorithm for Deep Neural Networks: A Review. International Journal of Computer Science and Information Security. 2016 [acceso 14/06/2020];14(7):376-81. Disponible en: https://arxiv.org/abs/1610.0526721. [ Links ]

22. Barredo Arrieta A, Díaz-Rodríguez N, Del Ser J, Bennetot A, Tabik S, Barbado A, et al. Explainable Artificial Intelligence (XAI): Concepts, taxonomies, opportunities and challenges toward responsible AI. Information Fusion. 2020;58:82-115. DOI:https://doi.org/10.1016/j.inffus.2019.12.01222. [ Links ]

23. Espino Timón C. Análisis predictivo: técnicas y modelos utilizados y aplicaciones del mismo - herramientas Open Source que permiten su uso [tesis]. España: Universidad de Cataluña; 2017 [acceso 14/06/2020]. Disponible en: https://core.ac.uk/display/7751584223. [ Links ]

24. Vaquero de Miguel M. Aproximaciones a la Explicación de Decisiones Algorítmicas: Inteligencia Artificial Explicable [tesis]. España: Universidad Politécnica de Madrid; 2020 [acceso 14/02/2021]. Disponible en: http://oa.upm.es/6338124. [ Links ]

25. González G. Agente Inteligente para Análisis de Datos de Carreteras [tesis]. España: Universidad Politécnica de Madrid; 2021 [acceso 14/11/2021]. Disponible en: https://oa.upm.es/68712/1/TFG_GONZALO_GONZALEZ_MORO.pdf25. [ Links ]

26. Sproston NR, Ashworth JJ. Role of C-Reactive Protein at Sites of Inflammation and Infection. Front. Immunol. 2018;9:754. DOI:https://doi.org/10.3389/fimmu.2018.0075426. [ Links ]

27. Romeo CM, Lazcoz G. Inteligencia artificial aplicada a la salud: ¿qué marco jurídico? 2020 [acceso 14/06/2021]. Disponible en: https://www.fundacionmercksalud.com/wp-content/uploads/2020/03/1.3.-IA-APLICADA-A-LA-SALUD.-Carlos-M.-Romeo-Guillermo-Lazcoz.pdf27. [ Links ]

Financiamiento

Policlínico Docente “José Ávila Serrano”. Velasco, Holguín, Cuba.

Recibido: 27 de Julio de 2022; Aprobado: 08 de Diciembre de 2022

^*Autor para la correspondencia. Correo electrónico: jvegaabascal28@gmail.com

Los autores declaran que no existe conflicto de intereses.

Conceptualización: Jorge Baudilio Vega Abascal.

Curación de datos: Jorge Baudilio Vega Abascal.

Análisis formal: Jorge Baudilio Vega Abascal, Alberto Rubén Piriz Assa.

Investigación: Jorge Baudilio Vega Abascal, Alberto Rubén Piriz Assa

Administración del proyecto: Jorge Baudilio Vega Abascal.

Supervisión: Jorge Baudilio Vega Abascal.

Visualización: Jorge Baudilio Vega Abascal, Alberto Rubén Piriz Assa.

Redacción - borrador original: Jorge Baudilio Vega Abascal.

Redacción - revisión y edición: Jorge Baudilio Vega Abascal, Alberto Rubén Piriz Assa, Diego Nápoles Riaño.