Introducción
Existe un notable interés internacional hacia la Imagenología Médica, vinculada al desarrollo tecnológico que ha ocurrido en el mundo de la electrónica y la informática en las últimas décadas. Se han perfeccionado las técnicas para la obtención de las imágenes, y han surgido nuevas ideas como la de fusionar dos imágenes de un mismo tipo, para mejorar su calidad o fusionar imágenes de modalidades diferentes para combinar y complementar la información de ambas, proporcionando una mejor perspectiva general sobre el caso a evaluar. 1-3
La Imagenología Médica (4 se define como el estudio de la anatomía, fisiología y patología humanas, basado en técnicas de imagenología. Existen diferentes modalidades de imágenes médicas, por ejemplo, la radiografía, el ultrasonido, la resonancia magnética, la tomografía, la termografía, entre otros (5. La principal ventaja de estos estudios es que permiten obtener información del interior del cuerpo de un paciente, sin realizar un procedimiento quirúrgico.
Dentro de los distintos tipos de tomografías se encuentran la Tomografía Computarizada y la Tomografía por Emisión de Positrones. La Tomografía Computarizada (CT, por sus siglas en inglés) 6,7 es una modalidad de Imagenología Médica que utiliza rayos X para crear imágenes transversales del cuerpo. La imagen de CT permite la adquisición de imágenes bidimensionales correspondientes a delgados cortes a lo largo del cuerpo del paciente. A partir de múltiples cortes consecutivos se puede realizar una reconstrucción del volumen correspondiente al área escaneada. Las imágenes de CT son capaces de mostrar de forma contrastada distintos tejidos. A diferencia de lo que ocurría con las radiografías proyectivas, no ocurre la superposición de estructuras, ya que la radiación reflejada en la imagen, correspondiente a la radiación incidente en un órgano determinado, no solapa con la detectada correspondiente a otro órgano distinto. Los estudios CT proporcionan imágenes anatómicas, o sea, que muestran la forma y estructura de los huesos y órganos del cuerpo. La información proporcionada por este tipo de imágenes está en dependencia de la parte del cuerpo que se examine.
La Tomografía por Emisión de Positrones (PET) 5,8 es una modalidad de Imagenología Médica en la que se utiliza una sustancia radiactiva, llamada marcador, para ubicar una patología en el cuerpo. La aniquilación de los positrones produce rayos gamma que se van atenuando a medida que viajan hasta el detector, que construye las imágenes a partir de la intensidad de los rayos capturados. Los estudios PET permiten analizar el funcionamiento de las diferentes partes del cuerpo y los factores químicos de los procesos fisiológicos que ocurren en el cuerpo.
Se ha reportado que el cambio de un examen PET independiente a PET/CT, puede cambiar el diagnóstico, por ejemplo, en el estudio de Schöder 9 donde se evaluaron 68 pacientes con cáncer de cabeza y cuello, 44 de ellos con sospecha de recurrencia de enfermedad residual. Se evaluaron 157 lesiones obteniéndose una exactitud de 96% para la PET/CT, en comparación con el 90% de la PET sola. Además, la PET/CT fue esencial para localizar de forma correcta 100 lesiones, redujo en un 53% el número de lesiones equívocas y cambió el manejo del paciente en el 18% de los casos. También se evitaron procedimientos diagnósticos innecesarios y la imagen híbrida pudo ser utilizada como guía para la toma de biopsias.
Debido al alto costo de los escáneres multifunción PET/CT, o sistemas híbridos, hasta el año 2017 en Cuba existían solamente tres 10. Por esta causa el proceso de diagnóstico basado en estas técnicas requiere, en la mayoría de los casos, que el especialista analice las imágenes de forma independiente para luego establecer la correlación entre ellas mentalmente, aumentando el tiempo de diagnóstico y no permitiendo el nivel de exactitud deseado en la ubicación de la patología detectada en el cuerpo del paciente. Esta falta de precisión, se hace más evidente en el caso de pacientes que necesiten intervención quirúrgica, pues, en muchos casos, aumenta los riesgos para este debido a que no es posible precisar la localización y dimensiones exactas de un tumor. El proceso resulta más costoso, pues aumenta también el consumo de material quirúrgico.
La presente investigación se propone realizar un análisis y selección de algoritmos que propicien la fusión de neuroimágenes, basado en la precisión de los mismos. De esta forma contribuir al desarrollo de software para desarrollar la fusión sin necesidad de adquirir equipos de adquisición de imágenes de alto rendimiento y costos.
Desarrollo
Proceso de fusión de imágenes médicas basado en software
El proceso de fusión de imágenes se compone de cuatro pasos (Fig. 1):
El corregistro de las imágenes, consiste en realizar una serie de transformaciones geométricas a las imágenes, para hacerlas coincidir en posición y tamaño. Es un proceso muy complejo, que requiere más tiempo del disponible para su estudio, se decide limitar esta investigación a la operación imprescindible, escalar las imágenes de entrada para hacer coincidir sus dimensiones.
El registro, transforma las imágenes a un dominio determinado (frecuencias, Wavelet, entre otros). Este paso podría omitirse, pero ejecutarlo resulta en una imagen fusionada con un mayor nivel de detalle.
Aplicar un algoritmo de fusión determinado a los coeficientes de la imagen, ya sea a los píxeles directamente o a los valores en el dominio seleccionado en el paso anterior.
Realizar la inversa del algoritmo de registro seleccionado. De no realizarse el paso dos, no es necesario realizar este último paso.
Métodos para el corregistro de imágenes
En el proceso de corregistro de las imágenes en el componente de fusión de imágenes PET/CT, es necesario escalar las imágenes para hacerlas coincidir en dimensiones, ya que la imagen CT tiene un tamaño de 512 × 512 píxeles, mientras que la PET tiene uno de 256 × 256 píxeles. Se aumenta el tamaño de la imagen PET, para aprovechar los beneficios de contar con una imagen con mayor resolución espacial. Para resolver esta situación se hace uso de la técnica conocida como interpolación.
La interpolación es el proceso de recuperar una superficie de intensidad continua a partir de muestras discretas de imágenes. Entre las técnicas más comunes de interpolación para el procesamiento de imágenes se encuentran la Interpolación Bilineal, la interpolación Bicúbica y la Interpolación por el Vecino Más Cercano. 11,12
La técnica de Interpolación por el Vecino Más Cercano es un método simple que requiere un tiempo de procesado bajo. Solo tiene en cuenta al punto más cercano al píxel interpolado y no los valores de los vecinos. Simplemente aumenta el tamaño de cada píxel. 11,12
La Interpolación bilineal tiene en cuenta los valores en los píxeles conocidos que rodean a uno dado en una vecindad de los 2 × 2 píxeles más cercanos, tomando sus valores promedios para producir el píxel medio. Esta técnica, aunque necesita más tiempo de procesamiento que la de por el Vecino más cercano, da como resultado una imagen más suave que la Interpolación del Vecino más cercano. 11,12
La Interpolación Bicúbica es el algoritmo de interpolación más utilizado, siendo un procedimiento estándar en programas de edición de imágenes, interpolación en cámaras, entre otros. Considera la vecindad de los 4 × 4 píxeles conocidos más cercanos, para un total de 16 píxeles, asignándole un mayor peso al cálculo de los más cercanos. Produce imágenes mucho más nítidas que los métodos de Interpolación bilineal e Interpolación por el Vecino más cercano. El hecho de que utiliza píxeles adicionales puede ser una desventaja cuando la imagen está siendo reducida en lugar de agrandada, porque también significa que más píxeles se descartan o se cambian. 11,12,13
El escalado de la imagen PET de entrada, se realizará utilizando la interpolación Bicúbica por las siguientes razones:
Es la técnica de interpolación de imágenes más usada.
Al tener coeficientes de mayor grado, la curva de aproximación es más suave.
A pesar de que tiene mayor costo temporal que las demás técnicas, se considera más importante la calidad de la imagen final.
Aunque el método de interpolación Bicúbica presenta desventajas con respecto al método de interpolación bilineal cuando se refiere a la reducción del tamaño de una imagen, para el desarrollo de un software de fusión se adapta el proceso de corregistro para realizar el escalado de la imagen PET a las dimensiones de la CT, asegurando la utilización del método para aumentar el tamaño de la imagen.
Principales tendencias de la fusión de imágenes médicas
Para poder seleccionar los métodos a utilizar en el desarrollo del componente, se realiza una investigación sobre estudios realizados por otros autores correspondientes a la fusión de imágenes.
En 14 se diseña un algoritmo de fusión de imágenes PET y CT basado en la transformada de wavelet mediante la utilización de la descomposición multiwavelet. Se implementa la fusión utilizando la media ponderada para la parte de bajas frecuencias y para la de altas frecuencias la fusión de los máximos sobre los coeficientes wavelet. Para evaluar los resultados se utilizaron los parámetros de niveles de Relación Señal Ruido (PSNR) y el Error Cuadrático Medio (MSE). Los resultados, de la Tabla 1, muestran que la imagen fusionada presenta más detalles y bordes más definidos que las imágenes de entrada.
En 15 se presenta un método híbrido basado en las transformadas de Wavelet y Curvelet para realizar la fusión de imágenes de CT e Imagen por Resonancia Magnética (MRI, por sus siglas en inglés). El método híbrido propuesto descompone N veces las imágenes pasando por filtros de bajas y altas frecuencias. Estas escalas de altas y bajas frecuencias son descompuestas aún más mediante Transformada de Curvelet, luego son fusionadas mediante la Transformada de Wavelet y se aplica la Transformada Inversa de Wavelet para obtener la imagen completa.
Para evaluar la calidad de las imágenes fusionadas se utilizan los parámetros de Entropía, Coeficiente de Correlación (CC, por sus siglas en inglés), Raíz del Error Cuadrático Medio (RMSE, por sus siglas en inglés), PSNR, Información Mutua (MI, por sus siglas en inglés) y Asociación de Bordes (representado como QAB/F). Se evaluaron estos parámetros para varios métodos de fusión obteniéndose los resultados mostrados en la Tabla 2.
A partir de los resultados obtenidos, los autores del trabajo 15 demuestran que las imágenes fusionadas obtenidas mediante la Transformada Híbrida contienen más información útil que las resultantes, usando la Transformada Wavelet o la Transformada de Curvelet.
En 16 se utiliza la transformada de Wavelet como un método para la fusión de imágenes de una misma escena que presenta desenfoque, con el objetivo de recuperar el nivel de detalle perdido. El método utilizado para la implementación del algoritmo fue la Transformada Wavelet de Haar. Para realizar la fusión se toma, de los píxeles de las imágenes de entrada que se ubican en una determinada posición <x, y>, el de mayor coeficiente de Wavelet y se asigna ese valor al píxel en la posición <x, y> de la imagen resultante de la fusión, puesto que los coeficientes de mayor valor corresponden a los bordes y cambios más relevantes en las imágenes. En los resultados se evidencia como la imagen resultante conserva los bordes y las regiones de alto contenido de detalle y no produce pérdida de contraste. Los autores de este trabajo 16, declaran los resultados obtenidos como altamente satisfactorios.
En 16 se utiliza la transformada de Wavelet como un método para la fusión de imágenes de una misma escena que presenta desenfoque, con el objetivo de recuperar el nivel de detalle perdido. El método utilizado para la implementación del algoritmo fue la Transformada Wavelet de Haar. Para realizar la fusión se toma, de los píxeles de las imágenes de entrada que se ubican en una determinada posición <x, y>, el de mayor coeficiente de Wavelet y se asigna ese valor al píxel en la posición <x, y> de la imagen resultante de la fusión, puesto que los coeficientes de mayor valor corresponden a los bordes y cambios más relevantes en las imágenes. En los resultados se evidencia como la imagen resultante conserva los bordes y las regiones de alto contenido de detalle y no produce pérdida de contraste. Los autores declaran los resultados obtenidos como altamente satisfactorios.
En 17 se evalúan varios métodos para la fusión de imágenes MRI y CT, uno basado en la Transformada Discreta de Wavelet (DWT, por sus siglas en inglés), otro en la Transformada de Curvelet de Segunda Generación, también conocida como Transformada Rápida de Curvelet (FCT, por sus siglas en inglés), y otro basado en la Transformada Discreta Rápida de Curvelet (DFCT, por sus siglas en inglés). La DFCT es una combinación de los métodos de fusión DWT y FCT. En la Tabla 3 se muestra como la imagen generada por el método DFCT posee características superiores a las generadas por los métodos de DWT y FCT.
Para la transformación al dominio de Wavelet se utiliza la Transformada de Haar, siendo este catalogado como el más usado para el análisis Wavelet. Una de las principales ventajas de la Transformada de Haar es los altos niveles de PSNR que presenta.
Para medir la calidad de las imágenes se utilizaron los parámetros de Entropía, donde un valor más bajo representa una mejor calidad, el parámetro PSNR, donde un valor más alto representa mayor calidad, y el CC, el cuál obtiene valores entre menos uno y uno, representando un valor más cercano a uno un mayor nivel de igualdad entre la imagen fusionada y la de origen.
En 13 se utiliza el método de fusión basado en wavelet para fusionar dos imágenes de un mismo órgano, una MRI y otra CT, teniendo como objetivo obtener más información para el diagnóstico que con una sola imagen. Se cataloga a los algoritmos de fusión basados en la transformada de wavelet como la forma más común para la fusión de imágenes, debido a su simplicidad y a la habilidad de preservar los detalles de tiempo y frecuencia de las imágenes a fusionar. En este trabajo se utiliza el método de Interpolación Bicúbica mostrando sus ventajas con respecto a los métodos de interpolación lineal, y el vecino más cercano. Los resultados muestran como el método utilizado para la fusión presenta mejoras en términos de reducción de ruido y realza los bordes en comparación a las imágenes de entrada.
En 18 se determina el enfoque basado en coeficientes wavelet apropiado para las tareas de fusión por las siguientes razones:
Es un enfoque multirresolución muy indicado para cuando se trabaja con distintas resoluciones de una misma imagen. En los últimos años, algunos estudios realizados con representaciones multiescala (descomposición piramidal) de una señal han establecido que la información multiescala puede ser muy útil en aplicaciones de procesamiento de imagen, incluyendo la fusión de imágenes.
La transformada wavelet discreta permite descomponer la imagen en diferentes tipos de coeficientes sin perder información.
Los coeficientes procedentes de distintas imágenes se pueden combinar para obtener nuevos coeficientes de forma que la información de las distintas imágenes de origen queda perfectamente integrada en estos nuevos coeficientes.
Una vez que se han integrado los coeficientes, se obtiene la imagen final fusionada mediante la Transformada Wavelet Discreta Inversa (IDWT, por sus siglas en inglés), manteniendo la información de los coeficientes manipulados.
En 18,19, para la toma de datos se obvió el segundo y tercer nivel en la descomposición wavelet, puesto que ofrecen resultados claramente peores que el primer nivel, tanto visualmente para un examen diagnóstico como en las medidas numéricas. Se evidencia como el uso de la Transformada Discreta de Haar para la descomposición wavelet obtiene iguales resultados a otras transformadas discretas, siendo esta la más sencilla. Para medir la calidad de las imágenes fusionadas se utilizan además de PSNR, CC, los parámetros de Error Cuadrático Medio Normalizado (NMSE, por sus siglas en inglés), Similitud Estructural (SSIM, por sus siglas en inglés) y MI.
Después de evaluar diferentes algoritmos de fusión de imágenes se aprecia que para la fusión de imágenes PET/CT sobre el dominio de Wavelet, el algoritmo que calcula la media ponderada gaussiana, con un tamaño de ventana entre cinco y once, mejora los resultados obtenidos con respecto a la utilización de media aritmética, nivel de actividad basado en ventana, media de imágenes multirresolución, varianza, nivel de actividad basado en coeficientes y la media ponderada laplaciana. 18
Discusión
Las imágenes de estudios PET son muy útiles para determinar la naturaleza maligna o benigna de un tumor, dada su capacidad para analizar las funciones metabólicas. Por otro lado, las imágenes CT permiten estudiar las estructuras anatómicas del cuerpo, lo que las hace especialmente útiles cuando se requiere establecer la ubicación exacta de una masa. Con el fin de adquirir información más completa como resultado de exámenes PET y CT, es común utilizar imágenes PET y CT combinadas (Fig. 2). Al fusionar estudios PET y CT se obtienen imágenes que combinan la información de las características fisiológicas y anatómicas del cuerpo de los pacientes.
Partiendo de los análisis anteriores se observa que, de los esquemas de fusión existentes, los más prominentes son el esquema basado en Wavelet y el esquema basado en Curvelet. El esquema basado en Wavelet es el que más ha sido utilizado, porque al descomponer las imágenes de entrada se obtiene una imagen fusionada que resalta los bordes y las zonas de concentración de altas frecuencias. El esquema basado en Curvelet muestras mejoras en la calidad de las imágenes resultantes con respecto a Wavelet. Sin embargo, este método es bastante reciente y aún no ha sido adoptado como tendencia en la comunidad científica, que sigue utilizando en su mayoría el esquema basado en Wavelet. Por tanto, los autores de este trabajo deciden emplear el esquema de fusión basado en Wavelet para realizar el proceso de fusión.
Dado que las imágenes están conformadas por coeficientes enteros, es necesario emplear una Transformada de Wavelet Discreta en esta situación. Para ello se elige la DWT de Haar, pues es la de función Wavelet más sencilla y utilizar una transformación distinta no produce cambios en los resultados de la fusión, además, esta transformada es la más usada en esquemas Wavelet18. Al utilizarse esta transformada discreta para llevar al dominio de Wavelet, en el paso final cuando sea necesario realizar la transformada inversa para obtener una imagen convencional, se deberá utilizar la Transformada Inversa Discreta de Wavelet de Haar.
Para realizar la fusión de los coeficientes de las imágenes, se tiene en cuenta el estudio realizado por Marín 18, en el que se evalúan varias reglas de fusión basados en varios parámetros de calidad de las imágenes resultantes. En dicho estudio, se concluye que la regla de fusión que calcula la media ponderada gaussiana, con un tamaño de ventana entre cinco y once, es el que mayores valores de calidad ofrece en la fusión de imágenes PET y CT. Dado que ambos tamaños de ventana ofrecen valores similares de calidad, se decide utilizar en este trabajo una ventana de tamaño cinco, pues constituirá una ligera mejora en cuando a costo computacional. En resumen, a la hora de fusionar los coeficientes de las imágenes se aplicará la media ponderada gaussiana con tamaño de ventana cinco.
Para el desarrollo de software de fusión de imágenes PET/CT, los autores del presente trabajo determinan proponer, basado en los estudios previos:
El esquema de fusión basado en Wavelet para desarrollar el proceso de fusión.
El método de Interpolación Bicúbica para realizar el corregistro de las imágenes.
La DWT y la IDWT de Haar para transformar las imágenes al, y desde, el dominio de Wavelet.
La regla de fusión media ponderada gaussiana con tamaño de ventana 5 para la fusión de los coeficientes.
Se recomienda investigar cómo influye la aplicación del esquema de fusión basado en el dominio de Curvelet al proceso de fusión de imágenes médicas PET y CT, para determinar si es factible su adopción en el marco de esta investigación.
Estudiar posibles métodos que utilicen inteligencia artificial, ecuación variacional Euler-Lagrange y el marco de trabajo del dominio de Fourier, para realizar el corregistro de las imágenes de entrada lo más exacta y eficientemente posible, enfocados en las características de las imágenes PET y CT.
Conclusiones
Se definió que el esquema de fusión basado en Wavelet resalta las características más prominentes de las imágenes, los bordes y las zonas de gran concentración de altas frecuencias.
Se determinó que las imágenes resultantes de la interpolación Bicúbica, a pesar de ser el procedimiento de mayor complejidad computacional, poseen mayor calidad que las de la interpolación por el Vecino Más Cercano y la interpolación Bilineal.
Se puntualizó que utilizar una Transformada Discreta de Wavelet distinta que la de Haar no aporta beneficios al proceso de fusión, a pesar de que posee la función de Wavelet más sencilla.