INTRODUCCIÓN
La naturaleza inespecífica y la variabilidad en las poblaciones animales, de las cuales se originan los datos productivos y sanitarios, dificultan el uso de los mismos para alertar eventos posiblemente relacionados con la salud, lo cual demanda un enfoque multidisciplinario y ordenado (1). No obstante, los análisis de series temporales en salud animal han demostrado utilidad para hacer inferencias a futuro (2). De forma notable, a partir de la década de los años 70 del pasado siglo, se incorporan herramientas basadas en la teoría desarrollada por Box-Jenkins (3), conocidas como Modelos ARIMA, <Autorregressive Integrated Moving Average> (del inglés) o Modelos Autorregresivos (AR) Integrados de Medias Móviles.
ARIMA es el modelo estadístico de predicción más común de series temporales y se ha empleado con éxito para pronosticar la producción de leche (4) y de carne (2), para detectar eventos anormales de mortalidad en el ganado bovino (1) y en la vigilancia y control de salmonelosis porcina (5).
La colecta de datos no específicos de los rebaños, combinada con análisis de series temporales, facilitan la vigilancia sindrómica (VS) en salud animal (6). El desarrollo de herramientas para la VS se estimula considerablemente como respuesta ante peligros de ataques bioterroristas en humanos (7). No obstante, rápidamente estas herramientas encuentran múltiples aplicaciones para eventos ordinarios, tanto en salud pública como animal, y actualmente son objeto de gran interés por su potencialidad para anticiparse en la alerta rápida respecto al diagnóstico formal de laboratorio (8,9).
Coutín (10) refiere que la modelación ARIMA, presentada por Box y Jenkins (3), ha sido empleada de forma creciente mundialmente en salud pública, debido a sus bondades para modelar adecuadamente el comportamiento de los eventos de salud y para la obtención de pronósticos del comportamiento de enfermedades transmisibles sujetas a vigilancia.
En Cuba existen experiencias en procedimientos estadísticos, modelación y simulación aplicadas a proceso agrarios (11); sin embargo, se enfocan al contexto productivo sin explotar el valor agregado de los datos asociados a la salud, en correspondencia con los preceptos de la VS (12). Dado el rol de la captura electrónica de datos, su transferencia, almacenamiento y análisis en la aplicación de sistemas de VS, la implementación de tales procedimientos puede verse afectada por el nivel de desarrollo y uso de las tecnologías de la información (13).
En el contexto nacional, los registros de datos productivos asientan predominante en copias duras y pueden existir limitaciones para su transferencia en tiempo casi real que sustenten la implementación de sistemas de VS. Como un primer paso para avanzar en esta dirección, se consideró evaluar el potencial de datos relevantes asociados a la salud para el desarrollo de la VS.
Entre los indicadores epidemiológicos, diversos estudios señalan la importancia de la mortalidad para monitorear el estado de salud de las poblaciones animales y la detección temprana de eventos inesperados (1,14). De otra parte, entre los indicadores reproductivos, los nacimientos presentan gran importancia por su relación con diversos factores y su particular impacto en la economía de la producción (15).
La producción porcina en Cuba se encuentra entre las principales fuentes de proteína de origen animal localmente producidas para consumo humano (16), por lo cual tiene alta importancia para la seguridad alimentaria. Con estos antecedentes se seleccionó una unidad de producción porcina tipo, donde se llevan registros digitales seriados de datos productivos, para evaluar oportunidades de VS a partir de los asociados a la salud de forma más relevante. Aun cuando existe un Sistema de Vigilancia Epizootiológico de alcance nacional (17), el desarrollo de procedimientos de VS pudiera complementar la alerta temprana ante posibles problemas sanitarios, incluso, medir progresos basados en el procesamiento y análisis de estos datos. El objetivo del presente estudio fue determinar incoherencias en los niveles de nacimientos y mortalidad en crías porcinas de una granja comercial típica, y predecir umbrales de alarma, mediante modelos ARIMA con vistas a la implementación de VS.
MATERIALES Y MÉTODOS
Fuente de datos y unidad de estudio
Se obtuvieron los indicadores número de nacimientos y mortalidad en crías procedentes de registros digitales de una unidad de crías porcinas, perteneciente a la provincia La Habana, Cuba. La unidad opera bajo condiciones de explotación comercial y tiene una capacidad de 125 reproductoras, que estuvo ocupada con un promedio de 112,75 (rango 96-125). Se tomaron series de ocho años (2010-2017) agregadas por mes, con 90 observaciones en cada una para el número de nacimientos y la mortalidad.
Procesamiento de datos
A ambas variables se les aplicó la metodología propuesta por Box y Jenkins (3). Para la construcción de los modelos ARIMA se utilizó el paquete estadístico STATISTICA 7.0 del 2004 (18), para lo cual se procedió de la siguiente manera:
Representación gráfica de la serie.
Estimación de las funciones de autocorrelación (FAC) y autocorrelación parcial (FACP).
Selección del mejor modelo ARIMA (criterio de Akaike) y verificación de los supuestos Admisible, Parsimonioso y Estable.
Predicción de valores por dos meses siguientes al último registro con 90% de confianza. En caso de número de nacimientos, se tomó en cuenta como predictor de alarma el límite inferior predicho y, en caso de mortalidad, el superior.
Para determinar el valor representativo como alerta se halló el promedio de los mismos y se procedió a establecer un único valor como alarma para cada indicador.
RESULTADOS Y DISCUSIÓN
La serie de nacimientos (Figura 1A) mostró variabilidad que ilustra las dificultades para detectar patrones anormales que justifiquen alerta y consiguientes intervenciones en respuesta. La limitación de la variabilidad fue menos ostensible en la serie transformada (Figura 1B), pero similarmente resulta difícil visualizar patrones anormales. Sin embargo, la tendencia al descenso en el número de nacimientos en el tiempo ilustró que los procesos que determinan el número de nacimientos tendieron a salirse de la zona de control.
De acuerdo a los registros de incidencia de la granja, la reducción neta del número de nacimientos fue significativa en tres momentos (agosto de 2011 con 105, diciembre de 2011 con 90, mayo de 2012 con 103 nacimientos), coincidentes con la disminución del número de reproductoras por limitaciones con el reemplazo. El descenso más marcado, correspondiente al mes 24 en la serie (diciembre 2011), pudo encerrar, además, la influencia del fenómeno denominado infertilidad estacional (19,20) debido, fundamentalmente, al efecto de las altas temperaturas en la reproducción. En consonancia con esto, los partos de diciembre corresponden a las cubriciones de agosto, el mes más cálido del año en Cuba (21). De otras causas potenciales, asociadas a la fertilidad, no se tuvieron evidencias.
Las causas de las observaciones anormales en el número de nacimientos fueron predominantemente por problemas de manejo, aunque se reconocen otras con repercusión en la reproducción (22). Por otra parte, esta tendencia, aunque ligera, reveló un elemento de preocupación estrechamente ligado a la productividad de los rebaños (15).
El modelo de autocorrelación para los nacimientos (Figura 2) indicó el número 1 como valor de (q) y, en el caso de la autocorrelación parcial (FACP), se estableció el número 4 como el valor de (p); además, se determinó que en la serie no existía periodicidad
Modelo Autorregresivo deducido:
Modelo:
El modelo resultante fue admisible (p <1), parsimonioso al no incluir cero en el intervalo, al mismo tiempo que se consideró estable por no encontrarse los parámetros correlacionados en consonancia con lo propuesto por Box-Jenkins (3).
En este estudio, bajo condiciones de explotación comercial, teniendo en cuenta el promedio de la predicción del límite inferior (Tabla 1) se estimó que el descenso del número de nacimientos mensuales por debajo de 109 debe constituir una señal de alarma y activar acciones de investigación.
Predicción | Intervalo confianza 90 % | ||
---|---|---|---|
Límite inferior | Límite superior | ||
Primer mes | 182 | 117 | 284 |
Segundo mes | 174 | 102 | 295 |
Promedio |
Modelo ARIMA〖 (1,1,0) 〗
Análisis de la serie de mortalidad
La serie mortalidad (Figura 2A) mostró una tendencia creciente en los primeros tres años. Las principales causas de mortalidad en esta primera etapa de la producción porcina pueden variar por factores ambientales, manejo y por enfermedades. En este estudio no se pudieron enmarcar, pero es relevante que la serie mostró parámetros fuera de los límites promedios que marcan la variación de los mismos. La limitación de la variabilidad fue menos ostensible en la serie transformada (Figura 2B), la cual permitió alcanzar mejores pronósticos con el modelo obtenido.
El modelo para la mortalidad (Figura 4) indicó como valor de (q) el número 1 y, en el caso de la (FACP), como valor de (p) el número 4; además, se determinó que en la serie no existía periodicidad.
Modelo autorregresivo deducido:
Modelo:
El modelo cumplió con los supuestos de ser Admisible, Estable y Parsimonioso; coincide así con lo propuesto en la metodología de Box-Jenkins (3).
La mortalidad pronosticada para los dos meses sucesivos a la corrida del modelo (Tabla 2) fue de 9,8 %, aunque con un límite superior de 12,67 %. Esta amplitud del nivel de alarma estuvo influida por el peso en el modelo de los valores anormales en el inicio de la serie. En este caso, los valores aberrantes de la serie coincidieron con problemas con la calidad del alimento. La corrida del modelo con la serie, a partir del año 2013, redujo el nivel de alarma por mortalidad a 10,6 %, lo que estuvo en mayor consonancia con la evolución de la tendencia y hasta con los promedios nacionales. De esta forma, sería un valor más preciso como umbral de alarma.
Predicción | Intervalo confianza 90 % | ||
---|---|---|---|
Límite inferior | Límite superior | ||
Primer mes | 9,82 | 7,70 | 12,52 |
Segundo mes | 9,83 | 7,49 | 12,82 |
Promedio |
Modelo ARIMA〖 (1,1,0) 〗
En unidades especializadas, el promedio nacional de mortalidad en crías durante el periodo de estudio se ubica entre 10,7 y 12 % con tendencia a decrecer (16). De otra parte, el Manual de Crianza porcina (23) establece 11% de mortalidad como normal para esta categoría. Las diferencias de estos indicadores fueron mínimas, respecto al pronóstico establecido por el modelo. No obstante, pueden interpretarse como potencial importante de mejora, dada la posibilidad de iniciar oportunamente acciones ante tendencias de desviaciones de este indicador.
Por mínima que sea la diferencia porcentual, no deja de tener importancia porque a nivel nacional los nacimientos anuales de la especie superan cinco millones de individuos (16), lo que implica la sustracción de aproximadamente 90 kg de carne en pie por cada animal que se pierda. De hecho, con posterioridad al destete, la mortalidad normal suele ser tan baja que el decrecimiento más importante de la población asienta en la etapa de cría.
La principal contribución del estudio, más allá de la predicción para la granja, está en mostrar la implementación de modelos ARIMA, los cuales constituyen una oportunidad para realizar pronósticos de las variables analizadas y superan en precisión otros métodos clásicos. En tal sentido, Peña et al. (24) consideran que la metodología de Box y Jenkins (3) permite desarrollar un cuerpo metodológico que identifica, estima y diagnostica modelos dinámicos de series temporales, en los que la variable tiempo juega un papel fundamental y donde se logra mayor flexibilidad al introducir los componentes aleatorios a las ecuaciones con mayor factibilidad de las predicciones.
Estos procedimientos analizan series temporales con modelos autorregresivos ARIMA, los cuales pueden activar un sistema de alerta de enfermedades a partir delas anomalías detectadas (25, 26). Asimismo, un análisis detallado de las relaciones entre los índices de producción podría ser parte de un sistema de vigilancia sindrómica muy simple para detectar y responder ante patrones que constituyan alarmas.
La implementación de este tipo de vigilancia no solo ofrece beneficios adicionales a la detección de alarmas verdaderas, sino que también permite el monitoreo de tendencias de enfermedad, facilita el control de enfermedades o infecciones, revindica el estatus de libre de enfermedades y provee datos para análisis de riesgo (27, 28,29). Otra de las bondades es el potencial de análisis casi en tiempo real, con lo cual se aseguran la alerta rápida y la respuesta oportuna (30, 31,32).
La capacidad del modelo para detectar patrones anormales, aun cuando no se hayan investigado otras causas potenciales de las desviaciones, ofrece una información de alta utilidad para la toma de decisiones sobre necesidad de investigaciones o intervenciones basadas en evidencias científicas. Constituyen, además, bases metodológicas para realizar sistemas de alerta que contribuyan a disminuir los riesgos para la salud animal y alcanzar los indicadores de crianza porcina con eficacia.
Los modelos descritos en este estudio constituyen información útil para detectar y monitorear la tendencia de indicadores con alta relación con la sostenibilidad y eficiencia de la producción porcina, con el valor agregado de estar relacionados con la salud. En los últimos años, la industria porcina a nivel mundial ha estado particularmente afectada por enfermedades emergentes, algunas de alto impacto (33), que demuestran claramente la necesidad de capacidades de alerta rápida. La propia naturaleza desconocida de las enfermedades emergentes hace que la VS pueda ser más consistente para revelar nuevas enfermedades, incluso, en fase presintomática (34).
El estudio se basó en una sola granja, pero la misma es representativa del tipo de producción comercial, además de tener la ventaja de contar con registros digitales seriados. El hecho de establecer, a través del modelo ARIMA, un umbral para alarmas en nacimientos, constituye una alternativa ante las limitaciones para detectar patrones anormales ante la variabilidad señalada. Estos modelos presentan transpolabilidad consistente, como demuestran estudios ante otras epidemias en curso en diferentes países (35). Por consiguiente, las similares condiciones de los sistemas de crianza comercial porcina en Cuba, durante la primera etapa de cría, permiten anticipar la utilidad del modelo desarrollado en cuanto a sus valores de alarma y empleo en otras granjas.
La capacidad de recopilar datos de manera rentable y oportuna de una amplia gama de fuentes, el uso de técnicas de minería de datos y análisis de series de tiempo, así como la posibilidad de generar informes dinámicos reproducibles, han conllevado al desarrollo de nuevas formas de realizar vigilancia casi en tiempo real (36). La evaluación de algunas de estas herramientas, como son los modelos ARIMA, reveló utilidad.
CONCLUSIONES
Los modelos ARIMA establecidos resultaron factibles para estrategias de vigilancia sindrómica, basada en series de datos de nacimientos y mortalidad, con predicción de umbrales de alarma (nacimientos < 109 crías y mortalidad > 10,6 %) que posibilitarían la alerta temprana y el desarrollo de respuestas oportunas para corregir desviaciones de los