Introducción
El SARS-CoV-2 es un coronavirus altamente infeccioso, causante de la epidemia de la COVID-19. Esta enfermedad apareció en diciembre de 2019 en Wuhan, China. Hasta el 15 de junio del 2020, la COVID-19 había acumulado 7 805 148 casos confirmados y 431 192 fallecidos.1 Hasta igual fecha, en Cuba se habían detectado 2262 casos positivos y 84 fallecidos.2 Dado el alto índice de letalidad de esta enfermedad, y el poco conocimiento que se tiene de sobre ella, se requiere que sea estudiada desde diferentes puntos de vistas. Un enfoque es investigar la agrupación de los casos, a partir de diferentes variables clínicas por medio de la técnica estadística de análisis de componentes principales (ACP).
El ACP es una técnica multivariada empleada para describir la variación de un conjunto de variables originales a través de un conjunto menor de variables no correlacionadas, llamadas componentes principales. Cada una de estas componentes es una combinación lineal particular de las variables originales. El ACP transforma la información multidimensional en unas pocas variables que explican una gran parte de las fluctuaciones de las variables originales y sus interrelaciones.3
Si los dos primeros componentes explican la mayor parte de la variabilidad de los datos, la gráfica de puntuaciones se puede utilizar para evaluar la estructura de los datos, detectar la normalidad multivariante, identificar los valores atípicos y revelar la tendencia de los puntos a agruparse. Por eso, el objetivo de este estudio fue identificar mediante componentes principales el agrupamiento de variables clínicas en los casos con COVID-19 en la provincia de Santiago de Cuba, Cuba.
Métodos
Se realizó un estudio observacional, descriptivo y transversal para evaluar la estructura de los datos e identificar agrupaciones. La población de estudio estuvo constituida por los 49 casos con COVID-19 confirmados por medio de la prueba de Reacción en Cadena de la Polimerasa en Tiempo Real (RT-PCR, del inglés Real Time Polymerase Chain Reaction) en los laboratorios de Biología Molecular del Centro Provincial de Higiene, Epidemiología y Microbiología de Santiago de Cuba y del Instituto de Medicina Tropical “Pedro Kouri” de La Habana. El periodo de estudio fue desde el 20 de marzo hasta el 30 de abril de 2020, en el cual se desarrolló el primer brote de la epidemia de COVID-19 en la provincia de Santiago de Cuba.
A partir de la frecuencia de ocurrencia de los síntomas y antecedentes patológicos personales (APP) presentados por los pacientes con COVID-19, se conformaron nueve variables: asintomático (Asinto), síntomas respiratorios (Sint_Resp), síntomas no respiratorios (Sint_NoResp), síntomas generales (Sint_Grales), no presencia de APP (No_APP), APP del sistema cardiovascular (APP_Cardiov), APP del sistema respiratorio (APP_Resp), APP del sistema neurológico (APP_Neuro) y otros APP (Otros_APP). Además de estas variables asociadas a los síntomas y APP se consideró el estado fallecido (Fallecido).
En cada una de las variables conformadas se tuvo en cuenta un conjunto de categorías.
Sint_Resp: tos, tos seca, odinofagia, rinorrea, estornudo, congestión nasal y expectoración.
Sint_NoResp: cefalea, vómito y/o diarrea.
Sint_Grales: fiebre, mialgia, malestar general, cansancio y/o falta de apetito.
APP_Cardiov: hipertensión arterial y/o cardiopatía.
APP_Resp: asma bronquial, enfisema, hiperactividad bronquial alérgica y/o enfermedad pulmonar obstructiva crónica.
APP_Neuro: esclerosis múltiple, Alzheimer, esquizofrenia, secuela neurológica, neuropatía y/o estar postrado.
Otros_APP: insuficiencia renal, colitis, glaucoma y/o leucemia.
Los datos de cada caso se obtuvieron a partir de las historias epidemiológicas. Estos datos se fueron actualizando diariamente en la base de datos provincial de la COVID-19, procedimiento supervisado por el equipo de epidemiólogos designados para este rol. Se asoció el valor 1 al caso que presentó algún síntoma o APP. Las variables Asinto, No_APP y Fallecido tomaron el valor 1 si el paciente era asintomático al momento del diagnóstico, no presentaba ningún APP o falleció, respectivamente.
Se procedió a la aplicación del ACP, a partir de la matriz de 10 columnas (variables) y 49 filas que corresponden a los valores registrados por las variables en los 49 casos diagnosticados en la provincia de Santiago de Cuba.
Previo a la aplicación del ACP se realizó, mediante la prueba de Levene, el análisis de homogeneidad de las varianzas, la cual arrojó un valor p significativo. Esto indicó la idoneidad de los datos para la aplicación del ACP.
Se determinaron los valores y vectores propios asociados a la matriz de correlación, el gráfico de valores atípicos, el de puntuaciones y el de influencias. El gráfico de valores atípicos permitió detectar los valores atípicos. El gráfico de puntuaciones representó las puntuaciones del primer componente principal contra las puntuaciones del segundo componente principal. El gráfico de influencias representó los coeficientes de cada variable para el primer componente contra los coeficientes para el segundo componente. Se empleó como procesador estadístico el Minitab versión 18.0.
Se mantuvo una conducta bioética acorde a lo dispuesto en la Declaración de Helsinki de la Asociación Médica Mundial.4 Se le asignó un código a cada caso para su representación y no revelación de su identidad. Los datos obtenidos fueron confidenciales y no serán utilizados para otros fines. Como los datos fueron subministrados por los laboratorios mencionados ut supra no se solicitó el consentimiento informado de los pacientes.
La investigación fue aprobada por el Consejo Científico Provincial de Ciencias Médicas.
Resultados
Se determinaron las frecuencias de ocurrencia de cada uno de los síntomas y APP de los casos con COVID-19 en la provincia de Santiago de Cuba (Tabla 1).
*Antecedente patológico personal | **Hipertensión arterial | ***Enfermedad pulmonar obstructiva crónica.
Se hizo el cálculo de los valores y vectores propios asociados a la matriz de correlación de los datos a partir de la aplicación del ACP. Se mostraron en este trabajo los valores propios mayores que 1 (Tabla 2) y los vectores propios asociados a ellos (Tabla 3). Se tuvo en cuenta los dos primeros componentes principales, a pesar de que solo explicaron el 45,6 % de la variabilidad total existente en los datos. El ACP corroboró lo reportado en los estudios epidemiológicos y clínicos.
Se obtuvieron las correlaciones entre las variables y cada uno de los componentes, a partir de los valores y vectores propios. En la tabla 4 se revelaron las variables que más aportaron al primer componente principal en dirección positiva: síntomas respiratorios, síntomas no respiratorios, síntomas generales y APP respiratorios. En dirección contraria aportaron las variables asintomático y no tener APP. Consecuentemente, este componente se asoció con los síntomas presentados por los casos.
Con respecto al segundo componente, las variables que más aportaron fueron Fallecido y los APP asociados al sistema cardiovascular, al sistema neurológico y a otros sistemas que excluyen al aparato respiratorio.
Se mostraron en la figura 1 los gráficos de valores atípicos (Fig. 1A), influencia (Fig. 1B) y puntuación (Fig. 1C) obtenidos del ACP. A partir del gráfico de valores atípicos se determinaron los casos atípicos, etiquetados con los números 186; 1188; 1215; 1323; 1921 y 2436 (Fig. 1A).
Los dos primeros componentes dividieron el plano en cuatro cuadrantes: cuadrante I (parte positiva de CP1 y de CP2), cuadrante II (parte negativa de CP1 y positiva de CP2), cuadrante III (parte negativa de CP1 y de CP2) y cuadrante IV (parte positiva de CP1 y negativa de CP2).
La ubicación de las variables en el plano de los dos primeros componentes principales (Fig. 1B) sugirieron que el CP1 está asociado con la presencia o no de síntomas y el CP2 con la presencia o no de APP, con excepción del APP respiratorio que se correlacionó fuertemente con el CP1. Esto condujo a la siguiente interpretación. En los cuadrantes I y IV se ubicaron las variables favorables para el desarrollo de la enfermedad. La vida de los pacientes con la COVID-19 que se ubican en el I cuadrante no está comprometida, a pesar de que tienen al menos uno de los tipos de síntomas y APP del aparato respiratorio. En el IV cuadrante se ubicaron las variables que contribuyeron a una evolución desfavorable de los pacientes, representadas por el resto de los antecedentes patológicos personales y el estado fallecido. Además, en los cuadrantes II y III se ubicaron las variables que propiciaron las condiciones menos favorables para el desarrollo de la COVID-19, como la no presencia de APP ni síntomas en el momento del diagnóstico.
En el gráfico de puntuación (Fig. 1C) se representaron los casos con la COVID-19 en el plano de los componentes principales. Este gráfico corroboró lo planteado anteriormente con respecto a la ubicación de las variables en el plano de los dos primeros componentes principales. Las elipses representan los 3 pacientes fallecidos que tuvo la provincia, los cuales se ubicaron en el cuadrante IV. Los cuadrados representan los casos que cursaron la enfermedad con estados críticos o graves, quienes se ubicaron en los cuadrantes I y IV, con excepción del caso 1344 (cuadrante III). La ubicación atípica de este caso puede deberse a que es un portador de la enfermedad de Alzheimer, lo cual pudo haber interferido en su declaración de los síntomas al momento del interrogatorio.
Discusión
La fiebre, la tos seca y el cansancio fueron los síntomas que primaron en los casos con la COVID-19 en Santiago de Cuba, en concordancia con lo reportado por la Organización Mundial de la Salud.5 Otra investigación realizada en la provincia Pinar del Río, Cuba, reportó como síntomas más frecuentes: tos (60 %), fiebre (40 %), fatiga (30 %), disnea (30 %) y congestión nasal (10 %); mientras que el 20 % de los casos fueron asintomáticos.6
La atipicidad reportada en seis casos puede ser debida a la presencia de síntomas o antecedentes con muy baja frecuencia (uno o dos) dentro del conjunto de datos. Se decidió no excluir los casos con baja frecuencia en la presencia de síntomas o APP por el poco conocimiento que se tiene de la COVID-19 y el número reducido de casos analizados. Se emplearon solo los dos primeros componentes principales, a pesar de que solo explicaron el 45,6 % de la variabilidad total, ya que la tendencia de los casos a agruparse coincidió con lo observado en la práctica
El hallazgo que los casos con evolución desfavorable se encuentren ubicados en el IV cuadrante del plano confirma que los APP tienen un rol esencial en la evolución desfavorable de los casos, lo cual concuerda con otros trabajos.7,8,9 En particular, se han señalado como agravantes de la COVID-19 las enfermedades del aparato cardiovascular,10,11) entre ellas la más mencionada ha sido la hipertensión arterial.12 Una posible explicación a la prevalencia de la hipertensión arterial en la pandemia de COVID-19 es su alta prevalencia en la provincia de Santiago de Cuba, la cual fue de 204,5 hipertensos por cada mil habitantes en 2019 y de 508,1 por cada mil habitantes en las edades mayores a los 65 años.13) Otros estudios confirman una asociación estadística altamente significativa entre la hipertensión arterial y la COVID-19 y, en general, con las afecciones cardiovasculares.14 Esta asociación ha sido explicada a partir del mecanismo por el cual el coronavirus se une a las células diana, por medio de la proteína espícula S, cuya unidad de superficie S1 se acopla a la enzima conversora de angiotensina 2 como receptor.15 Estos receptores aumentan en los hipertensos sometidos a tratamiento con inhibidores de la enzima conversora de angiotensina y/o antagonistas de los receptores de angiotensina, con lo que se incrementa el riesgo de desarrollar formas graves de la enfermedad que pueden conducir a severas complicaciones, incluyendo la muerte del paciente.16
Los casos que se ubican en el segundo cuadrante lograron sobrevivir y curarse a pesar de cursar la enfermedad con un cuadro clínico que pudo llegar hasta la gravedad. Este hallazgo puede ser explicado porque los pacientes no presentan APP del aparato cardiovascular.
Los casos que se ubican en el cuadrante III deben tener una mejor evolución, que se relaciona con la no presencia de síntomas y APP, a pesar de ser casos positivos confirmados con RT-PCR. Ellos pueden corresponderse con casos con la COVID-19 asintomáticos (28,57 % para la provincia de Santiago de Cuba). Estos casos han sido reportados en diferentes países.17,18,19
A pesar de la pequeña cantidad de datos, los resultados de este estudio evidencian que el ACP puede ser una herramienta útil para el agrupamiento de variables clínicas involucradas en la epidemia de COVID-19 en Santiago de Cuba, lo cual concuerda con los reportes clínico-epidemiológicos de la provincia. Además, los resultados sientan las bases para el pronóstico y tratamiento en tiempo real de pacientes con COVID-19 yotros APP. Para esto se requiere de la aplicación del ACP en diferentes instantes de tiempo.
Concluyendo, el ACP agrupa las variables clínicas y corrobora que los APP tienen el rol esencial en la evolución desfavorable de los pacientes con la COVID-19.