SciELO - Scientific Electronic Library Online

 
vol.40 suppl.1Infodemia y desinformación sobre COVID-19: Análisis bibliométricoManifestaciones oftalmológicas de la COVID-19 y bases de su transmisión ocular índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Articulo

Indicadores

  • No hay articulos citadosCitado por SciELO

Links relacionados

  • No hay articulos similaresSimilares en SciELO

Compartir


Revista Cubana de Investigaciones Biomédicas

versión On-line ISSN 1561-3011

Rev Cubana Invest Bioméd vol.40  supl.1 Ciudad de la Habana  2021  Epub 01-Mar-2021

 

Artículo de revisión

Perspectivas recientes del análisis morfológico automatizado en eritrocitos

Recent perspectives of the automated morphological analysis of erythrocytes

0000-0002-5006-6580Yaíma Paz Soto1  *  , 0000-0001-9238-3472Silena Herold García2 

1Universidad de Guantánamo, Cuba.

2Universidad de Oriente, Santiago de Cuba.

RESUMEN

Introducción:

La anemia drepanocítica es una anomalía genética hereditaria de la hemoglobina, que se caracteriza por la presencia de glóbulos rojos que pierden su forma redonda característica y adquieren forma de hoz. Aunque aún no tiene cura definitiva, se desarrollan varias acciones con el propósito de mejorar la calidad de vida y la atención médica a los pacientes.

Objetivos:

Conocer los aspectos referidos al análisis automatizado de formas en eritrocitos en los últimos años y proporcionar una visión en el caso de la drepanocitosis, que permita determinar las limitaciones actuales, principalmente para el empleo de herramientas automatizadas en el seguimiento clínico de pacientes con esta enfermedad.

Método:

Se realizó la revisión sistemática de la literatura de los años 2018, 2019 y dos aportes del 2020, en tres bases de datos electrónicas de amplio alcance: IEEEXplore, Google Scholar y SCOPUS. Los documentos se analizaron teniendo en cuenta preguntas específicas para obtener criterios generales sobre la situación de interés.

Conclusiones:

Los análisis realizados revelan un volumen creciente de investigaciones en este campo, con resultados de varios países. El examen detallado de las investigaciones permitió identificar problemas referidos a las métricas de evaluación empleadas, a los algoritmos para el análisis y procesamiento de imágenes, empleo del criterio médico, bases de datos empleadas y, herramientas para el análisis automático de formas de eritrocitos.

Palabras-clave: análisis morfológico de eritrocitos; revisión sistemática; análisis automático de forma; drepanocitosis

ABSTRACT

Introduction:

Sickle-cell anemia is a genetic hereditary anomaly of hemoglobin characterized by red blood cells that lose their normal round morphology and acquire a sickle shape. Although no cure is so far available, several actions are in progress to improve the quality of life and medical care of patients.

Objective:

Become acquainted with aspects related to the automated morphological analysis of erythrocytes in recent years, particularly in the context of sickle-cell anemia, allowing to determine the current limitations, mainly in the use of automated tools for the clinical follow-up of sickle-cell anemia patients.

Methods:

A systematic review was conducted of the literature published in the years 2018, 2019, and two contributions from 2020, in three broad scope electronic databases: IEEEXplore, Google Scholar and SCOPUS. The documents were analyzed on the basis of specific questions to obtain general criteria about the situation of interest.

Conclusions:

The analysis conducted revealed a growing volume of research in this field, with results in several countries. Detailed examination of the studies led to identification of problems related to the evaluation metrics used, the algorithms for the analysis and processing of images, the use of medical criteria, the databases used and tools for the automated morphological analysis of erythrocytes.

Key words: morphological analysis of erythrocytes; systematic review; automated morphological analysis; sickle-cell anemia

Introducción

La anemia drepanocítica consiste en una anomalía genética hereditaria de la hemoglobina, caracterizada por la presencia de glóbulos rojos que pierden su forma redonda característica y adquieren forma de hoz. Aunque esta patología aún no tiene cura definitiva, se desarrollan varias acciones con el propósito de mejorar la calidad de vida y la atención médica a los pacientes. El tratamiento implica el manejo del dolor, y se basa principalmente en pruebas complementarias. La observación de muestras de sangre periférica bajo el microscopio es realizada por un especialista en hematología. Este proceso adolece de la subjetividad generada por la experiencia de cada especialista, es agotador y propenso a errores dada la cantidad de campos visuales que deben observarse para poder emitir un criterio, situación agravada a medida que aumenta el número de muestras a analizar. El proceso puede favorecerse con el empleo de técnicas automatizadas de procesamiento de imágenes digitales para cuantificar la deformación de los glóbulos rojos, lo que facilita la obtención de resultados confiables, apoya el proceso de diagnóstico de seguimiento al paciente y permite la realización de este a una mayor cantidad de personas en menor tiempo, con la consiguiente mejora en la atención clínica.

En los últimos años las propuestas de automatización para el análisis de la deformación de eritrocitos han ido en aumento, esto ha permitido disponer de métodos efectivos basados en técnicas de reconocimiento de patrones. No obstante, en varios casos las investigaciones desarrolladas se realizan sobre imágenes relacionadas con la patología para comprobar los métodos propuestos, pero adolecen de problemas subyacentes que determinan la factibilidad del empleo en situaciones reales. Ejemplos de estos problemas son: no siempre se cuenta con un criterio experto que confirme la veracidad de la propuesta; se tienen experimentos con muestras de clases desbalanceadas, y métricas de validación no apropiadas, por lo que los resultados pueden estar sesgados; en pocos casos se han puesto a disposición de la comunidad científica bases de datos de imágenes, con el fin de que los resultados de diferentes investigaciones sean comparables; la mayoría de los estudios emplea imágenes propias y en muchos casos no se declara la forma de obtención de las mismas, lo que puede incidir en la respuesta de los métodos empleados, pues las condiciones de preparación de las muestras y obtención de las imágenes no son las mismas.

En este trabajo se han considerado las siguientes preguntas de investigación:

  1. Actualidad de las investigaciones, principales países y fuentes de publicación,

  2. Deformaciones morfológicas eritrocitarias estudiadas, principalmente la drepanocitosis y métricas utilizadas,

  3. Métodos de procesamiento digital empleados,

  4. Empleo del criterio médico en las investigaciones,

  5. Bases de datos de imágenes empleadas,

  6. Marcos y herramientas más utilizadas,

  7. Limitaciones existentes que proporcionan las bases para futuras direcciones de trabajo.

Es nuestro objetivo conocer los aspectos referidos al análisis automatizado de formas en eritrocitos en los últimos años y proporcionar una visión sobre las deformaciones morfológicas estudiadas. Además, determinar las limitaciones actuales, principalmente para el empleo de herramientas automatizadas en el seguimiento clínico de pacientes con drepanocitosis.

Métodos

Para el desarrollo de la investigación se efectuó una búsqueda en tres bases de datos electrónicas identificadas como relevantes (IEEEXplore, Google Scholar y SCOPUS), de los años 2018, 2019 y algunos trabajos del 2020. Sobre la base de las preguntas de investigación, se conformaron conjuntos compuestos por cuatro términos de búsqueda, distribuidos en cuatro grupos. Se realizaron búsquedas de texto completo con combinaciones de términos de los cuatro grupos, los que fueron combinados con el operador 'AND':

  • Group 1: Erythrocyte, Red Blood Cell, RBC, Sickle Cell,

  • Group 2: Cell Shape, Cell Form, Cell Deformation, Morphology,

  • Group 3: Automatic Analysis, Image Processing, Image Analysis, Computational Analysis,

  • Group 4: Classification, Differential Count, Cell Counting, Morphology Count.

Se incluyeron artículos referentes al análisis automatizado de formas en eritrocitos. No se valoraron artículos que, aunque se referían a patologías relacionadas con eritrocitos, no afectaban como tal la forma de estos (por ejemplo: la malaria), o que no fueron sometidos a revisión por pares.

El proceso de revisión se realizó a partir de los recursos de la metodología para desarrollo de revisiones sistemáticas de literatura propuesta por Kitchenham.1

Para determinar la validez de cada artículo incluido en la revisión, se establecieron criterios de calidad, con rangos asociados, que permitieran evaluar en qué medida el aporte responde a las preguntas de investigación y a las características relevantes de este:

  1. El objetivo está claramente definido [0..1].

  2. Se encuentra declarado en contexto con otros estudios referentes a análisis morfológico de eritrocitos, con presencia de drepanocitos [0..1].

  3. La decisión de emplear los algoritmos utilizados está justificada [0..1].

  4. La base de datos de prueba es reproducible [0..1].

  5. Es reproducible [0..1].

  6. El procedimiento experimental está rigurosamente explicado y es reproducible [0..1].

  7. Están definidos claramente los estudios para comparación [0..1].

  8. Las métricas de evaluación del desempeño están justificadas y explicadas [0..1].

  9. Los resultados son analizados y discutidos rigurosamente [0..1].

  10. La investigación alcanza los objetivos propuestos [0..1].

  11. Los resultados son evaluados y validados rigurosamente [0..1].

  12. Ofrece conclusiones claras basadas en evidencias y argumentos válidos [0..1].

  13. Está correctamente referenciada [0..1].

Los niveles de evaluación fueron otorgados por un investigador según criterio personal como un valor entre 0 y 1, y validados por otro investigador. En ambos casos, participaron especialistas informáticos con experiencia en el desarrollo de investigaciones en el área de procesamiento de imágenes médicas. El valor final de la calidad del artículo se obtuvo como promedio de los valores obtenidos en cada uno de los puntos evaluados. Los artículos se clasificaron según su evaluación en los siguientes rangos: (P) Pobre [0, 0,25]; (A) Aceptable [0,25, 0,45]; (B) Bueno [0,45, 0,65]; (MB) Muy Bueno [0,65, 0,85] y (E) Excelente [0,85, 1].

Todos los estudios obtuvieron una evaluación dentro de los tres últimos rangos.

Perspectivas del análisis morfológico automatizado en eritrocitos

El estudio incluyó la selección de un total de 22 artículos de revisión primaria (Tabla 1).

Tabla 1- Valores asignados en cada criterio de calidad 

Ref 1 2 3 4 5 6 7 8 9 10 11 12 13 Total
7 1 1 1 1 1 0,5 1 0,6 0,8 1 0,8 0,8 1 0,88
18 1 1 1 1 1 0,3 1 0,5 1 1 0,8 0,8 1 0,88
15 1 1 1 1 1 0,5 1 0,5 1 1 0,5 0,8 0,8 0,85
12 1 1 0,8 0 0,7 1 1 0,8 0,7 1 0,6 0,8 1 0,8
10 1 1 1 1 1 0 0,8 0,5 0,5 1 0,5 0,5 1 0,75
22 1 0,5 0,8 1 1 0,5 0,8 0,8 0,5 0,6 0,5 0,3 1 0,72
23 1 0,8 0,8 1 1 0,5 0,8 0,3 0,5 0,8 0,5 0,3 1 0,72
2 1 1 0,5 0,5 0,5 0,5 1 0,5 0,2 1 0,5 0,3 1 0,65
13 1 0,5 1 0,5 0,7 0,4 0,5 0,7 0,5 0,7 0,5 0,5 0,8 0,64
20 1 0,5 0,8 1 1 0,5 0,5 0,6 0,3 0,5 0,3 0,3 1 0,64
16 1 0,5 0,8 0,5 0,8 0,3 0,5 0,5 0,5 0,8 0,5 0,6 1 0,64
17 1 0,5 0,8 1 0,8 0,3 0,5 0,5 0,6 0,7 0,5 0,5 0,5 0,63
14 1 0,5 1 0,5 0,8 0,4 0,5 0,5 0,5 0,5 0,6 0,6 0,8 0,63
8 1 0,5 1 0,5 0,8 0,5 0,5 0,5 0,3 1 0,3 0,3 1 0,63
11 1 1 0,5 0 0,5 0,5 1 0,5 0,5 0,8 0,5 0,5 0,8 0,62
21 1 0,5 0,8 0,5 0,5 0,3 0,5 0,5 0,5 0,8 0,5 0,5 0,8 0,59
9 1 0,5 0,5 0 0,5 0,5 0,5 0,8 0,5 0,8 0,5 0,3 1 0,57
6 1 0,5 0,5 1 0,5 0,3 0,3 0,3 0,2 0,5 0,5 0,2 1 0,52
3 1 0,5 1 0,5 0,3 0,3 0,5 0,5 0,2 0,3 0,3 0,3 1 0,52
5 1 0,5 0,5 0,5 0,5 0,3 0,5 0,3 0,2 0,5 0,5 0,2 1 0,5
4 1 0,5 0,5 0,5 0,5 0,3 0,5 0,3 0,2 0,5 0,5 0,2 1 0,5
19 1 0,5 0,5 1 0,5 0,3 0,5 0,2 0 0,8 0,2 0 1 0,5

Nota: Los criterios de calidad se corresponden con los definidos en la lista de control.

Actualidad de las investigaciones, principales países y fuentes de publicación

En la tabla 2 se muestra la distribución de los estudios por año y base de datos y, se especifica, si son artículos de revistas o actas de conferencias, así como la clasificación final otorgada a cada uno de estos a partir de los criterios de calidad definidos anteriormente, en todos los casos con la referencia correspondiente.

Tabla 2- Cantidad de artículos por año, tipo y fuente 

Base de datos Tipo de publicación 2020 2019 2018 Total
Clasificación Clasificación Clasificación
IEEE Conferencia - E7 E18 2
- MB2 MB12 2
- B B19,9,14,16,21 5
SCOPUS Artículo - E E15 1
MB22,23 MB MB10 3
- B4,5,6 B17 4
Conferencia - B B11,20 2
Google Scholar Artículo - B3 B13 2
Conferencia - - B8 1
- 2 6 14 22

El 40,9 % de los artículos se publicaron en revistas o series indexadas por el Journal Citation Reports (JCR), o en bases de datos de alto prestigio como Scopus, o la Web de Ciencias: Metrology and Measurement System;4 Cluster Computing;17 Intelligent Data Analysis for Biomedical Applications;5 Healthcare Technology Letters;6 International Journal of Integrated Engineering;10 AIMS Bioengineering Journal;13 Advances in Intelligent Systems and Computing,15 Medical & Biological Engineering & Computing22) y Electronics.23 El resto de los trabajos se presentó en conferencias de gran impacto, una de ellas auspiciada por la Medical Image Computing and Computer Assisted Intervention Society (MICCAI) y las restantes por la IEEE.

La distribución de los estudios se comportó de la siguiente forma: tres (15 %) evaluados de Excelente (E),7,15,18 cinco (22,7 %) Muy Bueno (MB),2,10,12,22,23 y los 14 restantes obtuvieron la evaluación de Bueno (B).3,4,5,6,8,9,11,13,14,16,17,19,20,21

La revisión confirma que el análisis automático de formas de eritrocitos constituye un tema de interés. En estas investigaciones se destaca con cuatro investigaciones la India.2,9,12,16 Con dos investigaciones Malasia,5,10 Filipinas,14,21 Cuba7,22 y Australia.15,23 También incursionan países como Bangladés,6 China,11 España,20 Estados Unidos,19 Indonesia,8 Iraq,3 Pakistán,17 Polonia,4 Rumanía,18 y Turquía.13 En todos los casos siempre se toma como referencia el país del primer autor.

De los artículos clasificados como E, uno fue publicado en una revista indexada por Scopus,15 y dos en actas de congresos de la IEEE.7,18 De los clasificados como MB, dos fueron publicados en revistas indexadas por Scopus,10,22,23) y dos en actas de congresos de la IEEE.2,12

Deformaciones morfológicas eritrocitarias, principalmente la drepanocitosis y métricas utilizadas

En cada trabajo se estudia al menos una de las morfologías siguientes: drepanocitos, eliptocitos, esferocitos, dacriocitos, dianocitos, estomatocitos, esquistocitos, equinocitos, acantocitos y queratocitos. Se constató que los drepanocitos son de gran interés pues nueve de los trabajos (40,9 %) lo incluyen en su estudio, de ellos el 88,8 % fueron evaluados de E7,15,18 y MB,2,10,12,22,23 los restantes se evaluaron de B.11

En los artículos evaluados de E, uno utiliza una data desbalanceada para la experimentación,15 otro una data balanceada,7 y en el tercero no se especifica el tamaño de la muestra.18 En los evaluados de MB, tres utilizan una data balanceada10,22,23 y otros dos no especifican.2,12 En los trabajos evaluados de B, uno utiliza una data balanceada,11 otro una data desbalanceada,17 y otros seis no especifican la muestra empleada,3,5,8,19,20,21 solamente analizan resultados en base a porcentajes en cada clase, y en los seis restantes solo se analizan eritrocitos normales.4,6,9,13,14,16 Este análisis aporta que varios estudios proponen métodos cuyos resultados solamente han sido comprobados en muestras balanceadas, cuando en condiciones reales siempre existe una mayor cantidad de elementos de la clase normocitos y una pequeña cantidad del resto de las deformaciones. Las datas balanceadas, se obtienen al tomar objetos de las distintas clases en cantidades semejantes, a partir de las muestras observadas, para lo cual no se considera si las imágenes pertenecen a una misma muestra o no, situación que solo es aplicable para comprobar el desempeño de los métodos, pero no es posible asumir en una herramienta que se emplee como apoyo al especialista en la atención médica. Es recomendable comprobar el desempeño de los métodos frente a muestras desbalanceadas, más cercanas a la realidad en este tipo de imágenes. Asimismo, en varios estudios no se especifica el tamaño de la data empleada, esto limita la posibilidad de análisis de lo planteado en estas investigaciones.

Los trabajos que incluyen el análisis de los drepanocitos clasifican al menos tres clases diferentes, y emplean la métrica de exactitud para el estudio del comportamiento del proceso en su conjunto. Esta métrica representa el porcentaje total de elementos clasificados correctamente, lo que hace que sea adecuada cuando las clases en los datos están balanceadas. En caso contrario, su utilización no es la mejor opción pues el desbalance existente entre las clases puede generar menor efectividad del clasificador.

En la evaluación del comportamiento para cada una de las clases se emplearon las métricas de precisión, sensibilidad, especificidad y F1 score. En dos de los estudios,15,18 se empleó únicamente la métrica de exactitud, de esta forma no se efectúa un análisis a lo interno de cada clase lo cual resulta imprescindible para comprobar el comportamiento de los métodos en las clases de mayor interés.

La matriz de confusión no aparece reflejada en ninguna de las investigaciones, esto constituye una limitante para tener una visión más completa en la evaluación del rendimiento de los modelos al interior de cada clase estudiada, criterio que no se logra cuando se aportan solamente los valores obtenidos con las métricas empleadas, al no considerarse las cantidades reales de elementos que se valoran para obtener estas.

En este punto, es importante reconocer que los métodos propuestos en cada uno de los estudios analizados y los que puedan proponerse en el futuro en otras investigaciones, han de ser evaluados para asegurarse de que producen unos resultados válidos, y en dicha validación se deben tener en cuenta los criterios siguientes:

  • Cuando se tiene un conjunto de datos desbalanceado, la métrica de exactitud no es una medida válida para evaluar el rendimiento del modelo. En este caso deben emplearse métricas robustas para el caso de muestras desbalanceadas.

  • Las métricas de sensibilidad, precisión, especificidad y F1 de cada clase valorada son mucho más representativas y funcionan tanto si las clases están balanceadas como si no.

Métodos de procesamiento digital empleados

En el procesamiento de las imágenes se desarrollan generalmente las siguientes etapas: preprocesamiento; segmentación; extracción de características y clasificación.

En el preprocesamiento ocho trabajos (36,3 %),2,4,5,8,9,18,20,22 emplean operaciones morfológicas como complemento a algunas técnicas de detección de borde. Tres trabajos (15 %)2,5,12 emplean el filtro medio para eliminar los picos de intensidad que aparecen en áreas aisladas y otros tres (15 %),11,14,21 recurren al filtrado de suavizado espacial para reducir ruido. La ecualización adaptativa de histograma es aplicada en cuatro trabajos (20 %),4,9,12,16) para aumentar el contraste en la imagen. Nueve trabajos (40,9 %),3,6,7,10,13,15,17,19,23 no especifican el empleo de técnicas para preprocesamiento. Estas operaciones confirman que el realce de determinadas características de las imágenes, la corrección de distorsiones provocadas por los medios de adquisición y la realización de procesamientos matemáticos son operaciones que se deben ejecutar para mejorar la imagen con el fin de obtener información de utilidad diagnóstica. No obstante, aun cuando la imagen se mejora en cierta forma, no debe descartarse la posibilidad de pérdida de información de interés con este procesamiento previo.

Para la segmentación de dos trabajos (9 %) se emplea level set,7,22 y para otros dos (10 %) se hace con el empleo de watershed.21,5 Aunque estos proporcionan buenos resultados, necesitan del cálculo de gradientes, esquinas y otros elementos representativos que contribuyen a obtener los contornos que permitirán obtener la imagen asociada a la región de interés, lo que implica más complejidad computacional. Dos estudios (10 %),2,17 utilizan el algoritmo Fuzzy C-Means Clustering con buenos resultados, pero igualmente presentan tiempos de procesamiento y análisis altos. La transformada circular de Hough fue empleada en tres estudios (15 %),16,17,20 esta permite la detección y conteo de las células circulares (normales) presentes en la imagen, aunque presenta como limitación que la variación en la forma de los objetos en la imagen causa picos que traen consigo una detección inexacta. Otros cuatro estudios (18,1 %),11,15,19,23 emplearon redes neuronales para segmentar; estas arquitecturas son poderosas, pero necesitan un largo entrenamiento y muchas veces gran cantidad de neuronas ocultas, además del proceso de estabilización de los parámetros propios de cada modelo. El método de segmentación más empleado fue Otsu con siete trabajos (35 %).8,9,12,13,14,16,18 Es un método sencillo y relativamente eficiente en su empleo debido a las características propias de estas imágenes, que muestran células bien diferenciadas sobre el fondo. Este método se afecta por la presencia de elementos no deseables provocados por la propia preparación de las muestras y que pueden confundirse con células. No obstante, los detalles no válidos de los resultados obtenidos con esta segmentación pueden ser eliminados en gran medida posteriormente, al aplicar heurísticas u otras técnicas propias de cada trabajo. La ventaja de esta vía es que en conjunto, todo el proceso puede ser competitivo en cuanto a complejidad computacional respecto a los otros métodos valorados, aportando además resultados que propician la calidad de la ejecución de etapas posteriores del proceso de análisis de las células, todo lo cual hace que sea una variante válida para aplicar, sobre todo si se tiene en cuenta que se aplica en los momentos iniciales de un proceso donde las etapas posteriores suelen necesitar más tiempo de cómputo.

En la etapa de extracción de características, diecinueve estudios (86,3 %) efectúan este proceso, solo en tres casos no ocurre así, pues en uno,11 solo se efectúa la segmentación y en los restantes,19,23) se emplea una red neuronal desde la segmentación. En ocho estudios (36,3 %),3,8,12,13,14,17,18 se combinan descriptores de contorno y descriptores de región. Para ello emplean características de contorno como redondez,8,12,13,14,17) excentricidad,12 perímetro,17,18 diámetro,18 eje mayor,18 eje menor,18 y factor de forma;3,22) combinada con características de región como momentos,3,8,17 desviación,12 área,14,17,18 área convexa,14 color,13 y media.12,17

De los doce trabajos (54,5 %),2,4,5,6,7,9,10,15,16,20,21 que solo emplean descriptores de contorno, la redondez es usada solo en uno,10 el factor de forma se emplea en seis,2,4,6,10,15,22 la excentricidad la utiliza un trabajo,10 las funciones detectoras de borde son usadas en cuatro trabajos,5,9,16,21 la transformada circular de Hough en uno,20) y funciones basadas en geometría integral son empleadas en otra investigación.7 Estas últimas a pesar de ofrecer una descripción más completa de la forma, resultan más complejas en su funcionamiento.

En la etapa de clasificación trece trabajos (59 %) emplean las redes neuronales.2,3,4,6,8,10,11,13,15,17,19,20,21 A pesar de ser uno de los algoritmos de clasificación más empleado, necesita establecer un número elevado de parámetros de configuración y de las operaciones que se realizan en el entrenamiento, por lo que requieren muchos recursos de cálculo. Tres investigaciones (13,6 %),9,18,22 utilizan el método de Análisis Discriminante Lineal (LDA). Esta técnica tiene como desventaja que, en un problema con más de una clase, la clasificación de nuevas observaciones no es muy eficiente, a medida que se incrementa el número de variables del modelo. En seis estudios (27,2 %),2,3,10,12,17,23 se emplean las máquinas de soporte vectorial (SVM), aquí la dimensión de los vectores de entrada provoca una mayor complejidad en el preprocesamiento de los datos y un coste computacional más elevado durante la fase de entrenamiento. El método K-NN se empleó en tres trabajos (13,6 %),2,3,7 este es considerado como uno de los de mejor desempeño en el ámbito del aprendizaje automático, pero presenta como uno de los problemas esenciales el ajuste de los parámetros de entrada pues requiere conocer de antemano el valor de k para determinar los k vecinos más cercanos, además con valores distintos de k se obtienen resultados también distintos. El hecho de que cada instancia de k tenga que ser comparada contra todo el resto de los datos del conjunto provoca mayor lentitud en el proceso de clasificación.

En la tabla 3 se muestran los métodos empleados para la clasificación en los artículos que obtuvieron la categoría E y MB, respectivamente, con los valores de la métrica de exactitud para el proceso completo.

Tabla 3- Valores de la evaluación del proceso en los trabajos evaluados de E y MB 

Ref Clasificador Exactitud (Accuracy) Descriptores Tipo data
Excelente
15 Red neuronal 92,06 % Factor de forma Desbalanceada
7 K-NN 94,70 % Funciones de geometría integral Balanceada
18 LDA 96,00 % Perímetro, diámetro, eje mayor, eje menor, área No específica
Muy bueno
12 SVM 95,00 % Excentricidad, redondez, desviación, media No específica
10 Red neuronal 33,00 % Excentricidad, redondez, eje mayor, eje menor, factor de forma Balanceada
SVM 90,00 %
2 ELM 87,73 % Redondez, elongación, mean, desviación standard, varianza, simetría No específica
SVM 83,30 %
KNN 73,30 %
22 LDA 95 % (f-score) Área, factor de forma Balanceada
23 SVM 99,98 % Sin especificar Balanceada

En los estudios evaluados como E,7,15,18 los algoritmos propuestos logran resultados superiores a 90 % en todos los casos. Sin embargo, en dos de estos15,18 no se realiza un análisis a lo interno de cada clase por lo que se puede considerar que los resultados expuestos son parciales, dada la importancia que reviste el análisis de cada tipo de deformación en las células. El valor de sensibilidad obtenido en la clasificación de la clase de células drepanocitos es de 95,71 %.7 En el mejor de los casos, la experimentación es efectuada en un conjunto de datos balanceados. En cuatro de los trabajos clasificados como MB2,10,12,23 también se verifica la efectividad de los algoritmos propuestos mediante la métrica de exactitud. En uno de estos trabajos,12 se alcanza un 95 % de exactitud y un promedio de sensibilidad en la clasificación de las clases drepanocito y normocito de 96,55 %, que es un excelente resultado, pero expresado como combinación de los obtenidos para ambas clases, sin especificar el comportamiento en cada clase por separado. Abdulkarim Aliyu y otros10 emplean dos clasificadores: SVM y redes neuronales. El clasificador SVM exhibió mejores resultados de ejecución que la arquitectura de aprendizaje profundo, y alcanzó una exactitud en el proceso de 90 %, muy superior al valor obtenido con las redes neuronales, que fue de 33 %. El mayor valor de exactitud se alcanzó con este clasificador en las células otras deformaciones y normocitos (100 %), mientras que para las células drepanocitos fue de un 83 %. En otro de los artículos evaluados de MB, se emplea la métrica F-score22) y en los restantes, la exactitud fue inferior al 90 %.

Cuatro de estos artículos7,10,12,22 realizan un estudio diferenciado para las clases, lo que permite efectuar una valoración del desempeño de los métodos. Herold García y Fernandes,7 muestran resultados de sensibilidad obtenidos para normales, drepanocitos y con otras deformaciones de 96,50 %, 95,71 % y 91,90 % respectivamente, mientras que Delgado-Font y otros22 alcanzan valores de 98 % para normales, 92 % para drepanocitos y 56 % para otras deformaciones. Abdulkarim Aliyu y otros10 exponen que el clasificador SVM, que fue el de mejor rendimiento, clasifica correctamente en el 100 % de las células, otras deformaciones y normocitos, mientras que para las células drepanocitos fue de un 83 %. Saima Chy y Anisur Rahaman12 muestran un resultado conjunto de 96,55 %, pues aporta un promedio de la sensibilidad de ambas clases, algo que no es conveniente. En el resto de los artículos no se obtienen estos resultados para cada clase, por lo que es muy difícil valorar la efectividad del método en cuanto a las clases estudiadas y dado que en algunos casos las muestras son desbalanceadas, puede generarse confusión con el desempeño del método en relación con las clases de mayor interés, los drepanocitos o las de otras deformaciones.

Un total de 10 artículos evaluados de B3,4,5,6,8,11,16,19,20,21 muestran una exactitud superior al 90 %. Sin embargo, en la evaluación de la calidad de las publicaciones estos no alcanzaron una categoría superior, pues en algunos casos influyeron criterios referidos a la contribución al tema de estudio. Los trabajos citados4,5,6,8,11,16) solo analizan la forma normal de los eritrocitos, y en los casos restantes3,19,20,21 se tuvieron en cuenta razones como el análisis completo de los resultados y la explicación del procedimiento experimental, entre otros.

En sentido general, solo uno de los estudios analizados propone un algoritmo, en este caso referido a la identificación y conteo automático de las células sanguíneas.6 En el resto de los trabajos solo aparece reflejada la metodología propuesta, aunque en todos los casos es posible reproducir la misma.

Empleo del criterio médico

Para validar los resultados de la clasificación, el criterio médico resulta de gran importancia. Sin embargo, este aparece reflejado solamente en siete de las publicaciones analizadas.6,9,11,13,15,18,21 Asimismo, en la reproducción de los diferentes estudios publicados, resultan de gran importancia los datos utilizados en cada uno de estos.

Bases de datos de imágenes empleadas

En diez de estos estudios,6,7,10,15,17,18,19,20,22,23) se emplean imágenes de siete bases de datos públicas diferentes y en la tabla 4 se detallan las características de las mismas. En 10 estudios se emplean imágenes propias,2,3,4,5,8,9,13,14,16,21 y otros dos no refieren la base de datos de imágenes utilizadas,11,12 por lo que se asume que emplean imágenes propias. En todas las bases de datos empleadas se analizan deformaciones morfológicas de eritrocitos, pero es reducido el número de imágenes correspondientes a dichas deformaciones en cada una de esas bases de datos. Se declara el empleo de una base de imágenes pública, disponible en: http://erythrocytesidb.uib.es/ donde todas las imágenes son representativas de una sola patología, la drepanocitosis. Al menos el 45,4 % de los estudios seleccionados utiliza imágenes propias, lo que significa que cada trabajo emplea datos con características particulares generadas por los procesos de preparación de la muestra y adquisición de las imágenes, los que, aunque se desarrollen con la misma metodología, son dependientes de las condiciones propias asociadas a los laboratorios clínicos en los que se realizan. Es recomendable que, para la comprobación de los métodos exista una base de datos de imágenes de diferentes morfologías eritrocitarias (ground - truth) para realizar pruebas con respecto a la segmentación, extracción de características y clasificación para la comunidad científica en la verificación de las propuestas. Esa base de datos debe contar con una cantidad de imágenes de cada patología que esté incluida en la misma, suficientemente grande como para permitir la realización de los procesos de validación de los métodos propuestos con todo rigor científico (Tabla 4).

Tabla 4- Bases de datos de imágenes empleadas en los estudios seleccionados 

Nombre de la base de datos Descripción Ref
Datos de hematología de código abierto en línea de Pinterest https://www.pinterest.es/dchatmonjones/hematology/ Contiene imágenes de diferentes deformaciones morfológicas de eritrocitos: esferocitos, drepanocitos, dacriocitos, eliptocitos, acantocitos, estomatocitos y dianocitos. Para cada deformación contiene poca cantidad de imágenes, en ocasiones solo una. 10
Banco de imágenes de la Sociedad Americana de Hematología (ASH) https://imagebank.hematology.org/atlas-images/ Contiene imágenes de diferentes deformaciones morfológicas de células sanguíneas. Para cada deformación contiene poca cantidad de imágenes, en ocasiones solo una. 18,20
Base de Datos All-idb https://homes.di.unimi.it/scotti/all/#datasets Contiene imágenes de leucemia linfoblástica aguda. Provee un conjunto de imágenes específicamente diseñadas para la evaluación y comparación de la ejecución de algoritmos de segmentación y clasificación en este tipo de imágenes. No aporta imágenes específicas de deformaciones celulares de eritrocitos. 17
http://erythrocytesidb.uib.es/ Contiene 196 imágenes de campo visual completo y 629 imágenes de células individuales clasificadas como normales, drepanocitos y otras deformaciones. Todas las imágenes se relacionan con la deformación celular característica de la anemia drepanocítica. 7,22,23
http://sicklecellanaemia.org/ Es un recurso educativo de código abierto, dirigido a estudiantes y profesionales de la salud, que muestra varias propuestas entre las que se hallan algunas imágenes de pacientes con anemia drepanocítica. 15
https://github.com/Shenggan/BCD_Dataset Es una propuesta a pequeña escala para detección de células de la sangre. Aporta detalles sobre la preparación de las muestras. Contiene etiquetas para glóbulos rojos, glóbulos blancos y plaquetas. No detalla ninguna patología asociada. 6
https://github.com/devanshtandon/RBC-Classification-ConvNet Propuesta de dataset de 750 imágenes de diferentes patologías. Contiene etiquetas para diferentes tipos de eritrocitos entre los que se encuentran equinocitos, dacriocitos, eliptocitos, esferocitos, acantocitos, estomatocitos, dianocitos y esquistocitos. 19

Marcos y herramientas más utilizadas

Para el análisis automático de formas de eritrocitos en los trabajos seleccionados se emplearon diferentes marcos y herramientas. Se destaca la utilización de la herramienta Matlab en siete de los 22 trabajos analizados.10,15,18,21,5,7,23 Otras herramientas son empleadas en las siguientes propuestas: plataforma Weka;3 paquetes de código abierto en Python;14 marco de trabajo U-Net;11 TensorFlow;19 y librería Caffe.13 Otras diez publicaciones no refieren la herramienta utilizada.2,4,6,8,9,12,16,17,20,22 De esta forma se observa que en el análisis automático de formas de eritrocitos se han empleado diversas herramientas y marcos de trabajo, con énfasis en la utilización de Matlab que, aunque es la más empleada por los investigadores, es un software propietario.

Limitaciones existentes que proporcionan las bases para futuras direcciones de trabajo

En el análisis morfológico automático de drepanocitos, las principales limitantes se refieren a:

  • Utilización de métricas de evaluación del proceso no apropiadas para clases desbalanceadas.

  • Carencia de un criterio médico como parte del estudio.

  • Empleo mayoritario de imágenes propias y de bases de imágenes públicas que no cuentan con todas las características necesarias.

Conclusiones

  • El estudio de las deformaciones eritrocitarias, y entre ellas la asociada a la drepanocitosis, resulta un tema de gran interés para la comunidad científica en la actualidad, con aportes de varios países en revistas y congresos reconocidos en la comunidad científica.

  • El método más empleado en la etapa de preprocesamiento es el referido a las operaciones morfológicas, en la segmentación se destaca la utilización de Otsu, en la etapa de extracción de características, los atributos más empleados se corresponden con características elementales de la forma y, en la etapa de clasificación, el método más utilizado es el de redes neuronales.

  • La interacción con especialistas en la patología estudiada, la cual resulta imprescindible para apoyar los resultados obtenidos y garantizar la confiabilidad de estos, no es declarada en la mayor parte de los estudios analizados.

  • El empleo de imágenes propias o de bases de imágenes públicas que no cuentan con todas las características necesarias se refleja en gran parte de los estudios.

  • Las métricas de validación de los procesos de clasificación empleadas no se corresponden en todos los casos con las características de las muestras valoradas.

Agradecimientos

A los profesores del Departamento de Informática de la Universidad de Guantánamo; al Proyecto Institucional “Procesamiento Digital de Imágenes para el apoyo al monitoreo clínico de pacientes con la enfermedad de las células falciformes”, de la Universidad de Guantánamo; a la Cooperación de Bélgica para el Desarrollo, a través de VLIR-UOS (Flemish Interuniversity Council-University Cooperation for Development) dentro del programa IUC de la Universidad de Oriente; y al Proyecto PT241SC003-006 del Programa Territorial CITMA Delegación Santiago para Desarrollo de Productos y Servicios de Salud 2020.

Referencias bibliográficas

1.  Kitchenham B. Procedures for performing systematic reviews. Keele, UK: Keele University; 2004;33:1-28. [ Links ]

2.  Saima Chy T, Anisur Rahaman M. A Comparative Analysis by KNN, SVM & ELM Classification to Detect Sickle Cell Anemia. International Conference on Robotics, Electrical and Signal Processing Techniques (ICREST). Dhaka, Bangladesh. IEEE Engineering in Medicine and Biology Society; 2019. p. 455-9. [ Links ]

3.  Alkrimi JA, Aziz Tome S, George L. Classification of Red Blood Cells using Principal Component Analysis Technique. European Journal of Engineering Research and Science. 2019;4(2):17-22. [ Links ]

4.  Grochowski M, Wasowicz M, Mikolajczyk A, Ficek M, Kulka M, Wróbel M, et al. Machine Learning System for Automated Blood Smear Analysis. Metrology and Measurement Systems. 2019;26(1):81-93. [ Links ]

5.  Abdul Jamil MM, Oussama L, Mahani Hafizah W, Abd Wahab MH, Farid Johan M. Computational Automated System for Red Blood Cell Detection and Segmentation. Intelligent Data Analysis for Biomedical Applications. USA: Elsevier Co Inc.; 2019. p. 173-89. [ Links ]

6.  Mahmudul Alam M, Tariqul Islam M. Machine learning approach of automatic identification and counting of blood cells. Bangladesh: Healthcare Technology Letters IET Pub.; 2019;6:103-8. [ Links ]

7.  Herold Garcia S, Fernandes L. New Methods for Morphological Erythrocytes Classification. 41 Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Berlin, Germany. 2019. p. 4068-71. [ Links ]

8.  Rahmat R, Wulandari F, Faza S, Muchtar M, Siregar I. The morphological classification of normal and abnormal red blood cell using Self Organizing Map. IOP Conference Series: Materials Science and Engineering. IOP Pub.; 2018;308:012015. [ Links ]

9.  Ismail B, Moetesum M. Automated Detection and Quantification of Erythrocytes and Leukocytes from Giemsa Stains of Blood Smear. 14th International Conference on Emerging Technologies (ICET). Islamabad: IEEE Engineering in Medicine and Biology Society; 2018. p. 1-6. [ Links ]

10.  Abdulkarim Aliyu H, Sudirman R, Abdul Razak MA, Abad Wahab MA. Red Blood Cells Abnormality Classification: Deep Learning Architecture versus Support Vector Machine. International Journal of Integrated Engineering. 2018;10(7):34-42. [ Links ]

11.  Zhang M, Li X, Xu M, Li Q. RBC Semantic Segmentation for Sickle Cell Disease Based on Deformable U-Net. International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer. 2018. p. 695-702. [ Links ]

12.  Saima Chy T, Anisur Rahaman M. Automatic Sickle Cell Anemia Detection Using Image Processing Technique. International Conference on Advancement in Electrical and Electronic Engineering. Gazipur, Bangladesh: IEEE Engineering in Medicine and Biology Society; 2018. p. 1-4. [ Links ]

13.  Çelebi S, Burkay Çöteli M. Red and white blood cell classification using Artificial Neural Networks. AIMS Bioengineering. 2018;5(3):179-91. [ Links ]

14.  Joseph Meimban R, Ray Fernando A, Monsura A, Rañada J, Apduhan J. Blood Cells Counting using Python OpenCV. 23rd International Conference on Signal Processing. Shanghai, China: IEEE. 2018. p. 50-3. [ Links ]

15.  Alzubaidi L, Al-Shamma O, Fadhel AM, Farhan L, Zhang J. Classification of Red Blood Cells in Sickle Cell anemia using deep convolutional neural network. Advances in Intelligent Systems and Computing. Springer Nature Switzerland AG. 2018;940:550-9. [ Links ]

16.  Evangeline NC, Annalatha M. Computer aided system for Human Blood Cell Identification, Classification and Counting. 4th International Conference on Biosignals, Images and Instrumentation (ICBSII). India: IEEE Pub.; 2018. p. 206-12. [ Links ]

17.  Hamad Shirazi S, Iqbal Umar A, Ul Haq N, Naz S, Imran Razzak M, Zaib A. Extreme Learning Machine Based Microscopic Red Blood Cells. Zhiqiang: Cluster Computing; 2018:691-701. [ Links ]

18.  Safca N, Popescu D, Ichim L, Elkhatib H, Chenaru O. Image Processing Techniques to Identify Red Blood Cells. 22nd International Conference on System Theory, Control and Computing (ICSTCC). Romania: IEEE; 2018. p. 93-8. [ Links ]

19.  Alom Z, Yakopcic C, Tarek MT, Vijayan KA. Microscopic Blood Cell Classification using Inception Recurrent Residual Convolutional Neural Networks. IEEE National Aerospace and Electronics Conference. Indonesia: IEEE; 2018:222-7. [ Links ]

20.  Molina-Cabello M, López-Rubio, Luque-Baena R, Rodríguez-Espinosa MJ, Thurnhofer-Hemsi K. Blood Cell Classification Using the Hough Transform and Convolutional Neural Networks. World Conference on Information Systems and Technologies WorldCIST 18. 2018:669-78. [ Links ]

21.  De la Cruz J, Lazaro J. Morphological Image Processing and Blob Analysis for Red Blood Corpuscles Segmentation and Counting. 10th International Conference on Humanoid, Nanotechnology, Information Technology, Communication and Control, Environment and Management. Philippines: IEEE; 2018. p. 1-5. [ Links ]

22.  Delgado-Font W, Escobedo-Nicot M, Herold-García S, González-Hidalgo M, Jaumeli-Capó A, Arnau M. Diagnosis support of sickle cell anemia by classifying red blood cell Shape in peripheral blood images. Medical & amp; Biological Engineering & amp; Computing. 2020;58:1265-84. [ Links ]

23.  Alzubaidi L, Zhang J, Fadhel AM, Al-Shamma O, Duan Y. Deep Learning Models for Classification of Red Blood Cells in Microscopy Images to Aid in Sickle Cell Anemia Diagnosis. Electronics. 2020;9(3):1-18. [ Links ]

Recibido: 02 de Junio de 2020; Aprobado: 23 de Enero de 2021

*Autor para la correspondencia: ysoto@cug.co.cu o silena@uo.edu.cu

Las autoras declaran no tener conflicto de intereses.

Yaíma Paz Soto: Selección del contenido a exponer, redacción, revisión de la versión final y puesta a punto del artículo.

Silena Herold García: Selección del contenido a exponer, supervisión del trabajo y puesta a punto del artículo.

Creative Commons License