Introducción
El Comité Científico de Efectos de las Fuentes de Radiación Atómica y las Radiaciones Ionizantes de las Naciones Unidas (conocida por sus siglas en inglés United Nations Scientific Committee on Effects of Atomic Radiation Sources and Effects of Ionizing Radiation UNSCEAR) [1], señaló que el 61,6% de las dosis por exposiciones médicas se debe a estudios de tomografía computada (TC), con un incremento del total de estudios de un 80%, comparado con el informe anterior. Garantizar la calidad de esos estudios y el principio de la justificación de la exposición médica, demanda el desarrollo de un programa de control de calidad de los equipos de TC (CC), previsto ampliamente en nuestra regulación nacional y en las recomendaciones internacionales [2].
La evaluación de la calidad de la imagen (CI) es importante en todo medio diagnóstico para garantizar que las preguntas de diagnóstico se respondan correctamente, a esto se suma la necesidad de optimizar el proceso de obtención de la imagen con una dosis de radiación al paciente lo más baja posible [3]. Este aspecto es fundamental dentro del programa de control de calidad previsto, por esta causa los fabricantes de los equipos a nivel mundial, han establecido protocolos y maniquíes específicos para cumplir las recomendaciones internacionales. Sin embargo, estos maniquíes y/o procedimientos son establecidos por cada uno de ellos de forma independiente, situación que dificulta la comparación, verificación y reproducibilidad de sus resultados [2, 3]. A esto se suma la falta de recursos para comprar maniquíes estándar para cada hospital y que existe falta de físicos médicos que desarrollen estos controles de calidad de forma periódica, capacitados para analizar sus resultados y establecer acciones correctivas si estos exceden los límites de tolerancia establecidos. Por esta causa, este trabajo tuvo el objetivo de verificar una herramienta automatizada, que permite evaluar de forma versátil y amplia, parámetros cuantitativos de CI (CCI), a partir del procesamiento remoto o in situ de las imágenes DICOM generada con los maniquíes disponibles en cada institución, como solución al problema científico analizado.
Materiales y métodos
Este trabajo forma parte de las verificaciones para la puesta en marcha de una aplicación (denominada EvaCT), desarrollada por la primera autora en MATLAB 7.8.0 versión 2009a, que puede calcular un conjunto de parámetros de calidad de imagen a partir de las imágenes DICOM generadas por equipos de TC en maniquíes variados, destinados al CCI. Esta herramienta tiene carácter modular, comenzando por la lectura de la Megadata que obtiene los datos de las imágenes, la información general del estudio y la información dosimétrica; se adiciona una subrutina de visualización de cortes tomográficos que permite cambiar la ventana y el nivel de las mismas [3] para cada cálculo a realizar. Procesa las imágenes seleccionadas por el usuario para cada conjunto de pruebas de CI, cuantificado a partir de regiones de interés, perfiles en zonas elegidas, ajustes matemáticos, etc. según el caso y utiliza la interface gráfica para mostrar los resultados obtenidos. La aplicación exporta a Excel los resultados de las pruebas seleccionadas por el usuario y los detalles de la metodología empleada en cada caso [3, 4]. Esto permite analizar y dejar trazabilidad para su posterior análisis estadístico, evidencia de control y/o auditoria a distancia. Algunos de los parámetros a calcular tienen disponibles diferentes metodologías, que pueden seleccionarse según el diseño del maniquí con la intención de hacer más versátil la herramienta; y disponer de mayor información siempre que sea posible (ver Fig. 1). Las pruebas y metodologías empleadas en la herramienta se describen en la Tabla 1, que recoge todos los procesamientos realizados y sus detalles más importantes.
Uso de EvaCT como herramienta de control de calidad de imagen: Para la verificación funcional de esta herramienta y el establecimiento de los parámetros típicos (valores de referencia) se procesaron un conjunto de 17 exámenes completos de la rutina clásica de control de calidad de imagen (CCI) del tomógrafo Mediso PET/SPECT/CT Trio (equipo perteneciente al Centro de Investigaciones Clínicas de La Habana), que arrojaron resultados “aceptables” con el software del fabricante. Para este CC se utiliza un maniquí del propio fabricante que posee varias secciones: una homogénea de agua, otra con 6 cilindros rellenos de diferentes materiales (Polystyrene -950UH, Teflon 940UH), LDPE -64UH, Ertalon 95UH, Delrin 325UH, Acrylic 130UH) y otra con 4 alambres finos de alta densidad ubicados anguladamente en X e Y [3]. Para la rutina de CCI, el sistema utiliza tres protocolos de adquisición diferentes, en los que se varía el espesor de corte (0,625 mm; 5 mm, 10 mm), la corriente del filamento mA (12 mAs; 47,8 mAs; 95,7 mAs) y el índice de dosis volumétrico en TC (CTDIvol) (2,3 mGy; 7,6 mGy; 15,3 mGy). El estudio cubrió el desempeño del equipo durante los meses de julio, agosto, septiembre y octubre del 2022.
Los resultados que arroja la rutina de control de calidad Daily CT Quality Check, propia del fabricante Mediso, sólo calcula en los espesores 0,625 mm y 5mm la uniformidad, el ruido y la exactitud del número de TC en agua. Para 10mm de espesor de corte, además, se estima la resolución espacial de alto contraste (MTF) y los números de UH de los 6 materiales del maniquí [5]. Este sistema utilizando las mismas imágenes, calculó todos los parámetros descritos para cada corte. En el caso del FWHM y RCR se estimaron los valores promedio de cada estructura, como índice del comportamiento general del sistema (FWHMbp y RCRp respectivamente, ver formalismos en Tabla 1) (figura 1).
Siempre que los parámetros obtenidos por EvaCT tuvieron contraparte de cálculo por el fabricante (parámetros clásicos), se compararon estadísticamente y se aplicaron los niveles de tolerancias establecidos por el fabricante; cuando no fue posible se empleó como criterio el Protocolo Nacional [2] y/o las recomendaciones del Organismo Internacional de Energía Atómica (OIEA) [7]. Para la comparación de variables numéricas clásicas se empleó la prueba de rangos con signo de Wilcoxon (no paramétrico, pareado) con nivel de confianza del 95% y p<0,05 de significación estadística (IBM SPSS Statistics 20, IBM, Armonk, NY). En los casos de las variables y/o pruebas no referidas por el fabricante (descritas en este caso como no clásicas) como la resolución de bajo contraste, la escala de contraste, la relación contraste ruido, el FWHMp y FWHMbp; etc. se analizó su comportamiento temporal, así como la relación física existente y su dependencia a través de la estimación del coeficiente de correlación muestral de Pearson, con nivel de confianza del 95% y p<0,05 de significación estadística. Se establecieron los valores promedio y las desviaciones estándar (DE) para emplear como referencia para futuras evaluaciones (referencia y/o línea de base).
Parámetros y/o pruebas | Metodología y/o expresión | Notas |
---|---|---|
Ruido * | Se siguen indicaciones del protocolo nacional. [2] | La evaluación del ruido se ejecutará no sólo en la imagen central, sino también en aquellas más externas. |
Número de TC * | Se siguen indicaciones del protocolo nacional. [2] | La ROI en agua o equivalente. Verificar que no existan artefactos. |
Uniformidad de No. de TC* | Se siguen indicaciones del protocolo nacional. [2] | Verificar que no existan artefactos. |
Linealidad de los números de TC y Escala de Contraste** | Se siguen indicaciones del protocolo nacional. [2] por ajuste lineal o por diferencias absolutas | El número de lesiones depende del maniquí. En caso de aplicarse el ajuste lineal, verificar el R2 del ajuste (R2 ≥ 0,95). El valor de la pendiente de la gráfica obtenida en la prueba de linealidad del número TC |
Resolución de bajo contraste** | Se siguen indicaciones del protocolo nacional. [2] | Lesiones/estructuras de materiales con bajo número atómico efectivo (ejemplo: acrílico y aire) |
Distorsión espacial* | Se siguen indicaciones del protocolo nacional. [2] | La imagen debe ser siempre circular nunca elíptica. |
Resolución Espacial de alto contraste*** | Se calcula el FWHM50% según elección del usuario, acorde con el maniquí, por metodologías variadas: 1.- Empleando alambres o lesión puntual de alto contraste, ajuste función gaussiana, acotado como |
EvaCT tiene la capacidad de calcular la resolución espacial a partir de perfiles en X e Y, sobre un punto de material (función puntual) de alto contraste o a partir de alambres ubicados en dirección de ambos ejes. [2], 3] Puede determinarse también la resolución espacial sobre sobre estructuras de materiales conocidos, trazando perfiles en dirección de los ejes X e Y, que van desde el centro de la estructura, hasta una vecindad fuera de ella. [4, 5] |
Relación Contraste-Ruido** | Según la expresión: | A partir de regiones de interés definidas sobre cada lesión/ estructura del maniquí, y el material de fondo, VMP es el número de HU promedio en estructura o fondo y DE es la desviación del número de HU respectivamente. [3, 4, 5] |
Para cualquier maniquí: *Zona uniforme de agua o material equivalente, **zona de lesiones cilíndricas de diferentes materiales embebidos en agua o material equivalente, ***Zona de alambres finos <0,5mm (2 o 4) o un punto de alta densidad materiales embebidos en agua o material equivalente.
Resultados y discusión
Los resultados de los parámetros calculados por la herramienta EvaCT, en estos 17 exámenes completos, se muestran y discuten a continuación. Los resultados de los valores promedios por corte (0,525 mm, 5 mm y 10 mm) y su desviación estándar para los parámetros como el Número de TC, Ruido, Uniformidad, Distorsión espacial, Artefactos, Parámetros relacionados con la sensitibidad y la Relación Contraste Ruido, se reportan en la Tabla 2.
Número de TC, Ruido, Uniformidad, Distorsión espacial y Artefactos
Los valores promedio de los números de TC encontrados fueron 1.3±0.6UH (entre 0,6 y 3,1UH), 0,7±0,9UH (entre -0,6 y 2,4UH) y 0,6±0,6UH (entre -0,4 y 2,1 UH) para 0,625 mm, 5 mm y 10mm respectivamente; mientras que el ruido mostró valores promedios porcentuales de 0.9±0.1% (entre 0,8% y 1%), 1,5±0,8% (entre 0,4% y 2,1%) y 1,1±0,71% (entre 0,26% y 2,7%). Los valores promedio para 10mm estimado por los datos del fabricante para estos parámetros fueron 1 ± 0,6 UH y 2,8±0,2%. En un estudio comparativo realizado por Barca et al., (2021), [8] el ruido encontrado en 5 equipos diferentes varió entre 3.5 ± 0.1HU (Siemens-64 scanner) y 5.7 ± 0.1 HU (GE-16RT scanner) para un maniquí de Catphan, empleando software ImageJ.
En el comportamiento temporal de la uniformidad es consistente con el encontrado por el fabricante durante sus controles periódicos (±4UH), y también por debajo del valor de tolerancia señalada por el protocolo nacional y el OIEA como deseable (±4UH). H. Khodajou-Chokami y cols, (2020), [9] estimaron en un sistema independiente de análisis de calidad, con un maniquí de diseño propio similar al Mediso, una uniformidad promedio de 1.12UH, en un tomógrafo de 64 cortes GE LightSpeed VCT scanner (GE Healthcare Technologies). Valores similares se obtuvieron por Mansour Z. y cols, (2016) [10]; en el análisis del maniquí de ACR (por sus siglas en inglés American College of Radiology) que arrojó un valor de 3.4UH (inferior a la tolerancia de ±4UH) en un TC multidetector Brilliance (Philips Medical System, Eindhoven, The Netherlands). La distorsión espacial mostró valores promedios de 0.7±0.6mm (entre 0 y 1.5mm), 0.7±0.6 mm (entre 0 y 1.5mm) y 0.6±0.4mm (entre 0 y 1.5) para 0.625, 5 y 10mm respectivamente, todos menores de 2 mm [2, 7, 8]. Tampoco se visualizaron artefactos en ninguno de los cortes, de los 17 estudios.
SEnsitometría (linealidad de los números de TC)
Se estudiaron varios parámetros relacionados con esta propiedad que tiene el sistema imagenológico, entre los que se encuentran la exactitud de los números de UH, la escala de contraste, la resolución de bajo contraste y otros indicativos de linealidad de los números de TC (ver tabla 2).
De forma general, los valores de número de TC por estructura estimados mediante EvaCT, se encuentran en el rango previsto atendiendo al criterio impuesto por el fabricante para el espesor de corte 10mm, excepto el Delrin, que mostró un comportamiento anómalo incluso dentro de los resultados del análisis del fabricante (ver tabla 2, promedio obtenido 360±1,3 UH con recomendación 325±10%), en el cual estuvo ligeramente fuera de rango en algunos casos, y en el resto se comportó cercano al límite superior de la tolerancia. Este comportamiento anómalo se repite en los resultados obtenidos por EvaCT para el corte de 10, mostrando la capacidad del sistema de cumplir con su función.
En el caso especial del Delrin, el valor medio obtenido para todos los espesores de corte es superior al valor reportado por el fabricante, y se muestra cercano al límite superior de la tolerancia establecida por el CECMED de ±20UH de la línea de base, e incumple también las tolerancias recomendadas por el OIEA ±10UH de la línea de base, estos últimos más restrictivos.
En el caso del Poliestireno el valor medio es -968,4±19,9 UH y el Teflón 931,0±18,4 UH para 10mm, desviación estándar que se muestra sobre los límites de tolerancia establecidos por el CECMED (41% y 53% de los casos incumplen este límite respectivamente). Este patrón se repite en el resto de los cortes para los tres materiales, alcanzando en el caso del espesor 0,625mm para el Poliestireno y Delrin el 100% de los casos, y el 41% para Teflón. Esta situación no es infrecuente, como corroboran algunos autores como Njiki CD y cols. (2018) [11] y Barca P y cols. (2021) [8], que encontraron discrepancias de este orden en protocolos clínicos, pero debe observarse cuidadosamente, para evitar que se produzca un deterioro de ese parámetro a mediano o largo plazo.
La resolución de contraste entre los materiales aire-acrílico, mostró valores promedios de (2,2±0,35) E-4, (2,3±0,50) E-4 y (2,3±0,45) E-4 en los cortes 0.625, 5 y 10mm respectivamente. La escala de contraste promedio arrojada por el software para cada espesor de corte mostró valores promedios de (1,8±0,04) E-4, (1,9±0,3) E-4 y (1,9±0,4) E-4 en los cortes 0.625, 5 y 10mm respectivamente. Ambos parámetros en el mismo orden y con desviaciones estándar también similares.
La linealidad de los números de Hounsfield mostró índices de correlación R2≥0,98, indicando que el sistema responde de manera lineal y que las ligeras desviaciones de los números de UH son aceptables.
La escala y resolución de contraste, no cuentan con una referencia previamente definida, por lo que corroborar sus valores numéricos o tolerancias no es posible, aunque la correlación de ellas entre sí fue positiva, con coeficiente de correlación de Pearson de 0,8 (p=0,001) y 0,9 (p=0,001) para 5 y 10mm respectivamente. R. Y. Castillo en 2008 [12] estimó la escala de contraste, para protocolos afines, para 7 equipos de varios fabricantes, con valores entre 1,3E-4 y 2,2 E-4, muy similares a los obtenidos en este estudio. El CECMED en su informe de puesta en marcha y apto para uso clínico, para un equipo Mediso SPECT/CT Anyscan SC en 2016, reportó un valor de resolución de contraste de 1,9E-4, valor también similar al encontrado en este trabajo [14].
Relación contraste ruido (RCR) por estructura y promedio (RCRp)
La relación contraste-ruido muestra un rango amplio de variación por estructura y por protocolo durante el tiempo estudiado. Los valores para estructuras con alto contraste como el poliestireno y el teflón muestran valores máximos modulares de 412 y 378, y mínimos de 57 y 50 respectivamente para el corte 10mm. Expresando una tendencia a la disminución cuando disminuye el espesor del corte, expresando una fuerte dependencia con las condiciones de adquisición y procesamiento (ver tabla 2).
Estudios anteriores han mostrado también una alta variabilidad de este parámetro por equipos y por protocolos, ejemplo es el trabajo de Khodajou-Chokami H y cols, (2020), [10] que reporta valores para LDPE, Teflón y Acrílico de 2.4, 20.7 y 2.2, respectivamente para un equipo 64-slice GE LightSpeed VCT scanner (GE Healthcare Technologies, Waukesha, WI). P. Barca et al, (2020), [8] mostró un amplio rango de variación en 5 equipos de diferentes fabricantes con protocolos similares, LDPE entre 31-73, Teflón 140-233, Acrílico 4.7-10.6 y 38-89 para Delrin. Este parámetro es altamente dependiente de los métodos de adquisición y reconstrucción como han documentado estos autores y otros como la Asociación Americana de Radiología (por sus siglas en inglés ACR, en 2017) [15], CD Njiki et. al, (2018) [11] y A. López y col, (2022) [3].
La Tabla 3 muestra la existencia de una correlación significativa inversa entre la RCR promedio por corte por día (RCRp), la escala de contraste y la resolución de bajo contraste en cortes de 5.0mm y 10mm. Esta relación no se expresa en el caso de 0,625mm, confirmando el carácter complejo y la dependencia de los métodos de adquisición y reconstrucción confirmada por otros autores en sus publicaciones [7, 8, 9, 11, 14].
Relación contraste ruido (RCR) por estructura y promedio (rcrp)
Tanto la FWHM calculada sobre los insertos (materiales de densidad variada, FWHMbp), como la calculada sobre alambres (estructuras de alto contraste, FWHMp), informan de la capacidad intrínseca del sistema de detectar estructuras como independientes (dependiendo del contraste la primera y en estructuras de alto contraste la segunda). Los resultados de los valores promedios de ambos métodos se muestran en la Tabla 3 para todos los estudios y cortes.
Resolución espacial en estructuras de alto contraste (FWHMp): Los valores de FWHMp obtenidos fueron de 1,4±0,1 mm (1-1,5 mm), 1.0±0.3 mm (0.7-1.5 mm), y 1.2±0.3mm (0.8-1.5 mm) para los espesores de corte de 0.625, 5 y 10mm respectivamente. Se aprecia la estabilidad del parámetro FWHMp de manera general, en los diferentes cortes, dando información reproducible de la respuesta del sistema en la detección y correcta delimitación espacial de las diferentes estructuras. R. Castillo en 2008 estimó la FWHMp, en protocolos afines, para 7 equipos, de varios fabricantes con valores entre 0,8mm y 1,25mm, valores cercanos al 1,0±0,3mm obtenido en este estudio para el protocolo de 5mm de espesor de corte (espesor semejante al estudiado en el estudio referido) [12]. La correlación entre la FWHMp promedio por día y la RCRp, en cortes de 5.0mm y 10mm fue positiva y estadísticamente significativa, mostrando una r=0.6 (p=0.007) y de 0.8 (p=0.0). Esta relación no se expresa en el caso de 0,625mm, confirmando el comportamiento observado en parámetros anteriores.
Resolución espacial de bordes promedio (FWHMbp): Los valores promedio obtenidos fueron de 0,8±0,1 mm (0,6-1 mm), 1±0.5 mm (0,4-1,9mm) y 0,8±0,3 mm (0,5-1,4 mm) para los espesores de corte de 0,625 mm, 5 mm y 10 mm respectivamente. Este parámetro mostró una desviación típica de la media mayor que FWHMp (10% para 0,625mm, 44% para 5mm y 36% para 10mm vs. 8%, 25%, 23% respectivamente en el caso de FWHMp), este hecho debe relacionarse con el rango más amplio de contraste que poseen las estructuras a resolver.
Existe además una correlación estadística significativa, de signo negativo, entre la FWHMbp y la RCRp, por día, en cortes de 5.0mm y 10mm, mostrando una r=-0.6 (p=0.016) y de -0.6 (p=0.012) respectivamente, indicando que la disminución de la RCRp se corresponde con un incremento numérico de la resolución espacial (es decir un deterioro de la capacidad resolutiva del sistema). Esta correlación no se expresa en el espesor de corte 0,625mm, como en las magnitudes anteriores, confirmando el comportamiento del resto de los parámetros.
Otros detalles generales: Este estudio está limitado a un sólo equipo y a un sólo maniquí, se recomienda ampliar su empleo a otros equipos y maniquíes, e incluso estudiar su utilización en protocolos clínicos, explorando otras potencialidades del sistema con vistas a la optimización de dosis.
Conclusiones
La herramienta EvaCT fue capaz de evaluar satisfactoriamente los parámetros cuantitativos de calidad de imágenes en un equipo Mediso de forma diferida, brindando además una mayor información sobre las métricas relacionadas con la calidad de imagen, por lo que supera la información disponible y aumenta las potencialidades del mismo. Después de un estudio inicial, esta herramienta permite instaurar los valores de referencia del equipo y comparar resultados en el tiempo, como elemento facilitador para establecer un monitoreo sistemático, favoreciendo a largo plazo la implementación de la normativa nacional y su consolidación, así como la creación de estrategias de intervención en caso necesario.