INTRODUCCIÓN
El control de los dispositivos de prótesis de extremidades superiores mediante la señal de electromiografía (EMG) y el reconocimiento de patrones (PR) se ha considerado como un enfoque prometedor. El enfoque convencional en EMG generalmente utiliza un número limitado y muy bien localizado de electrodos. En contraste, el enfoque de reconocimiento de patrones permite el uso de una matriz de electrodos de alta densidad que forma una matriz de señales de electromiografía de alta densidad (HD-EMG). En este trabajo, utilizamos los resultados del uso de técnicas de procesamiento de imágenes para el reconocimiento de gestos basado en HD-EMG descrito en (Díaz-Amador, y otros, 2019) para mitigar los efectos de la variabilidad entre sesiones en el uso de prótesis mioeléctricas. La muestra instantánea de cada canal EMG se representa como un píxel de una imagen que cambia con diferentes movimientos. La resolución espacial (número de píxeles por unidad de área) está definida por los electrodos de la matriz, es decir, el número de electrodos y sus distancias entre electrodos.
El uso de HD-EMG para analizar cómo se componen y distribuyen los patrones de activación muscular y el comportamiento único de MUAP no es nuevo en la investigación de reconocimiento de patrones. Recientemente, el uso de matrices de electrodos se extendió para clasificar los gestos y descifrar la intención del movimiento (Rojas-Martínez, y otros, 2013). En trabajos anteriores (Rojas-Martínez, y otros, 2012), la representación de HD-EMG se realiza como matrices en 2-D llamadas topografía EMG o EMG map. Por lo general, el mapa se define como una imagen de intensidad 2-D de promedio de tiempo en la que cada píxel es el valor del cuadrado medio de la raíz (rms) de un determinado canal en una ventana de tiempo o como muestras instantáneas de HD-EMG.
En (Amma, y otros, 2015) se informó un resultado de 89.8% y 90.4% de precisión en la clasificación de 27 gestos usando una matriz de electrodos 8x24. En (Geng, y otros, 2006), un enfoque de red convolucional profunda obtuvo el 99%, 96.8% y 52.1% de precisión para tres conjuntos de datos utilizando imágenes instantáneas y muestras instantáneas como características.
En este trabajo se compara el uso de la extracción de características de imagen dividiendo la imagen instantánea en parches (bloques), analizando tres tamaños y ubicaciones de bloques diferentes.
METODOLOGÍA
Conjunto de datos
Los datos de HD-EMG se obtuvieron de la sub-base de datos DB-a en la base de datos de CapgMyo (Du, y otros, 2017). Estos datos se recopilaron (Du, y otros) utilizando un dispositivo portátil no invasivo que consta de 8 módulos de adquisición, cada uno de los cuales contiene una matriz de electrodos diferenciales de tipo matriz (8x2). Cada electrodo tiene un diámetro de 3 mm y se dispuso con una distancia entre electrodos de 7,5 mm horizontalmente y 10,05 mm verticalmente. Los electrodos húmedos de plata fueron desechables y se cubrieron con gel conductor, con una impedancia de contacto de menos de 3 kΩ. Los 8 módulos de adquisición se fijaron alrededor del antebrazo derecho con bandas adhesivas. El primer módulo de adquisición se colocó en el músculo extensor digitorum communis a la altura de la articulación radiohumeral; el resto se colocaron equiespaciados a la derecha (mirando desde la perspectiva del sujeto), formando una matriz de electrodos de 8x16. Al recolectar HD-EMG, ningún músculo individual se mide directamente, sino la superposición combinada de todos. De esta manera, cada electrodo adyacente contiene información redundante.
Las señales de EMG se muestrearon a 1 kHz, se digitalizaron con un convertidor de analógico a digital de 16 bits y se filtraron pasa-banda con un ancho de banda entre 20-380 Hz. Los datos de EMG de los 8 módulos de adquisición se empaquetaron en un controlador ARM y se transfirieron a una PC a través de WIFI (Du, y otros).
La base de datos contiene 8 gestos de manos isométricos e isotónicos obtenidos de 18 sujetos. Se pidió a los sujetos que mantuvieran cada gesto durante 3 a 10 segundos. Los gestos considerados se muestran en la Figura 1 y corresponden a las clases 13-20 en la base de datos NinaPro (Atzori, y otros, 2014). Cada gesto fue grabado 10 veces.
De cada una de estas clases se tienen las 10 grabaciones tomadas en dos días diferentes con una separación de 7 a 8 dias entre cada sesión.
Experimento
En este trabajo se realiza un experiemnto que consiste en utilizar el método leave-one out para demostrar que el uso de técnicas de rasgos de imágenes es más robusto ante la variabilidad inter-sesiones que la utilización de los rasgos dominiotemporales tradicionales. La Figura 2 muestra el esquema de cómo se realizan los experiemnto.
Los resultados obtenidos por ambos métodos se comparan utilizando un test no paramétrico de Wilcoxon con un valor de significancia de p = 0.05.
Extracción de rasgos
En el proceso de extracción de los rasgos se calculan los rasgos en el domio del tiempo con rasgos basados en imágenes. Los rasgos en el dominio del tiempo considerados en este trabajo son descritos en (Hudgins, y otros, 1993) y consisten en el valor absoluto medio (MAV), los cruces por cero (ZC), la longitud de la forma de onda (WL) y los cambios de signo de pendiente (SSC). Las expresiones para cada uno de ellos se ven en las ecuaciones 1-4:
Valor Medio absoluto (MAV)
Cruces por cero (ZC)
Longitud de la forma de Onda (WL)
Cambio de signos de la pendiente (SSC)
En las ecuaciones (1) a (4), x i representa la amplitud de la muestra i de EMG, N es la longitud en muestras de la ventana de análisis y th es un umbral tomado como el 5% del MAV en la ventana de análisis.
Los rasgos basados en procesamiento de imágenes considerados son los descritos en (Díaz-Amador, y otros, 2019) y se pueden dividir en rasgos basados en pixeles, rasgos basados en textura y rasgos de forma. Se describen en las ecuaciones de la 5-10:
Energía (En)
Máximo Valor de Intensidad (MIV)
Posición de la máxima intensidad (PMI)
Contraste
Correlación
Homogeneidad
Clasificación
Elegimos un clasificador de vecino más cercano (kNN). Evaluamos valores impares para k de 1 a 11 con la distancia euclidiana. En la fase de entrenamiento, proporcionamos un conjunto de datos de entrenamiento correspondientes a las primeras cinco repeticiones de cada movimiento. En la fase de clasificación, utilizamos las cinco repeticiones restantes. Es importante aclarar que, a los fines de la investigación actual, el conjunto de datos se equilibró, lo que mitiga los efectos de las clases no equilibradas en el reconocimiento de patrones basado en kNN.
RESULTADOS Y DISCUSIÓN
Los resultados obtenidos se muestran en la Figura 3, medidos por la precisión en la clasificación cuando se utiliza cada una de las sesiones como entrenamiento y como sesión de prueba.
En la Figura 3 se observa que la utilización de los rasgos propuestos mejora en 15 % a la utilización de los rasgos en el dominio del tiempo. De esta forma la variabilidad inter-sesión es más evidente en los rasgos dominio-temporales que en los propuestos debido a que los rasgos basados en la representación 2D son más robustos a las variaciones temporales de la señal.
CONCLUSIONES
Los resultados sugieren que la utilización de rasgos a partir de la representación 2D propuesta en este trabajo muestra una mayor robustez a la variabilidad inter-sesiones. Este resultado, unido al desarrollo de sistemas de sensores cada vez más económicos, constituye un avance hacia el desarrollo de sistemas de control más robustos a los cambios que ocurren en la señal electromiografíca. En este sentido, un trabajo futuro inmediato es evaluar esta propuesta utilizando un mayor número de sesiones espaciadas a lo largo del tiempo.