Ingeniería Electrónica, Automática y Comunicaciones

EDITORIAL

Detection and location of background leakage in plastic water pipes under a noisy environment

RESUMEN La detección y localización de fugas de fondo es un tema que presenta gran importancia para los sistemas de distribución de agua debido a que dicho fenómeno es uno de los eventos que intervienen en la pérdida de este recurso natural. Este problema ha propiciado que exista gran interés por la comunidad científica en desarrollar procedimientos que mejoren la detección y localización de la fuga de fondo, realizando para esto mediciones bajo un ambiente controlado. No obstante, en la práctica las señales de fuga coexisten con el ruido blanco y el de color. Por tal motivo, en este artículo se propone un nuevo procedimiento para detectar y localizar la fuga de fondo bajo un ambiente ruidoso. Para realizar la detección se utilizó la función coherencia y en la localización se empleó un filtro digital pasa banda para aplicar la función correlación cruzada en la gama de frecuencias donde mejor relación señal a ruido exista. Para validar y comparar el procedimiento propuesto con los reportados por la comunidad científica se utilizó MATLAB y se adquirieron 150 señales en el laboratorio, las cuales fueron divididas en dos grupos. El primero presenta 90 señales con presencia de fuga de fondo y en las del otro grupo solamente existe ruido. Tras finalizar el análisis el nuevo procedimiento utilizado arrojó un error de 2.1 % en la localización de la fuga de fondo.

ABSTRACT Detection and location of background leaks in water pipes is an issue of great importance for water distribution systems because this phenomenon is one of the events involved in the loss of this natural resource. This problem has led to great interest by the scientific community in developing procedures that improve the detection and location of the background leak, making for this measurements under a controlled environment. In practice, however, leakage signals coexist with white and colored noise. For this reason, this article proposes a new procedure for detecting and locating background leakage under a noisy environment. In order to carry out the detection, the coherence function was used and in the location a digital band-pass filter was used to apply the cross-correlation function in the frequency range where the best signal-to-noise ratio exists. To validate and compare the proposed procedure with those reported by the scientific community, MATLAB was used and 150 signals were acquired in the laboratory, which were divided into two groups. The first group presents 90 signals with the presence of background leakage and in the other group there is only noise. After finishing the analysis, the new procedure used showed an error of 2.1 % in the location of the background leak.

Proposal for the monitoring of sedation states in electroencephalographic signals

RESUMEN Durante un procedimiento quirúrgico es esencial inducir al paciente estados de inconsciencia, amnesia, analgesia y relajación muscular, sin embargo, debido a la inexactitud en la monitorización de la anestesia se reportan casos de despertar intraoperatorio. A causa de la incidencia de este fenómeno, el Centro de Estudios de Neurociencias, Procesamiento de Imágenes y Señales en la Universidad de Oriente, Cuba, lleva a cabo la implementación de un prototipo de monitor de anestesia basado en el reconocimiento automático de estados de sedación en las señales electroencefalográficas usando técnicas de Inteligencia Artificial. Para alcanzar el objetivo propuesto se evaluó el desempeño de un clasificador Naive Bayes y tres Máquinas de Aprendizaje: Redes Neuronales Artificiales con cinco topologías diferentes, Sistemas de Inferencia Difusa basada en Redes Adaptativas y las Máquinas de Soporte Vectorial para reconocer tres estados de sedación caracterizados por nueve parámetros de potencia obtenidos a partir del espectro de frecuencia de las señales registradas por los canales electroencefalográficos frontales F4 y Fz. Como resultados de los experimentos se reconocieron los estados de Sedación Profunda, Sedación Moderada y Sedación Ligera con una Exactitud de 96.12%, 90.06% y 90.24% respectivamente usando las Máquinas de Soporte Vectorial y los registros del canal electroencefalográfico F4.

ABSTRACT During a surgical procedure it is essential induce to the patient, unconsciousness states, amnesia, analgesia and muscle relaxation, however, cases of intraoperative awareness are reported for the inaccuracy in monitoring anesthesia. Due the incidence of this phenomenon, the Center for Neuroscience Studies, Images and Signals Processing from Universidad de Oriente, Cuba, is carried out the development of an anesthesia monitor prototype, based on automatic recognition of sedation states in electroencephalographic signals using Artificial Intelligence techniques. To achieve the proposed objective, were evaluated the performance of a Naive Bayes classifier and three Machines Learning: Artificial Neural Networks with five different topologies, Adaptive Network Based Fuzzy Inference System and Support Vector Machines to recognize three sedation states characterized by nine power parameters obtained from the frequency spectrum of the signals recorded by two electroencephalographic channels front F4 and Fz. As results of the experiments, the states Profound Sedation, Moderate Sedation and Mild Sedation were recognized with an Accuracy of 96.12%, 90.06% and 90.24% respectively using Support Vector Machines and the registers of F4 electroencephalographic channel.

Ears Images Normalization for Biometric Recognition

RESUMEN La alineación de imágenes es un paso crucial en los sistemas de reconocimiento basado en imágenes biométricas, ya que facilita su análisis y comparación. En particular, las imágenes de la oreja pueden presentar problemas de oclusión por el pelo, pendientes o sombreros. Estas oclusiones disminuyen la zona de reconocimiento de este objeto biométrico; así como la variación de la iluminación en el proceso de captura aumenta la dificultad de extracción de rasgos o puntos fiduciales. La información mutua es una técnica estadística basada en la información proporcionada por la distribución de las intensidades en las imágenes. El método propuesto basado en esta técnica no depende de los valores reales de los píxeles sino de cómo están distribuidos en la imagen, esto le permite enfrentar problemas de oclusión, efectos de la iluminación, y ruido. En este trabajo, mostraremos la utilidad de la información mutua entre las imágenes de orejas para su alineación. Para ello, se realizaron varios experimentos comparando este método con otros de carácter estadístico, como los de PCA y otros basados en puntos fiduciales, tales como el proceso de interpolación y muestreo warping. La evaluación de resultados se realiza mediante secuencias de reconocimiento utilizando la representación funcional de la oreja.

ABSTRACT Image alignment is a crucial step in recognition systems based on biometric images, since it facilitates image analysis and comparison. In particular, ear biometric images may present occlusion problems because of hair, earrings or hats. These occlusions decrease the ear recognition zone; as well as the variation of lighting in the capture process increases difficulty of extracting traits or fiducial points. Mutual information is a statistical technique based on the information provided by the distribution of the intensities in images. The proposed method based on this technique does not depend on the actual values of the pixels but on how they are distributed in the image, this allows you to deal with problems of occlusion, effects of lighting, and noise. In this paper, we will show the usefulness of mutual information between ear images for their alignment. To do this, several experiments were conducted comparing this method with others of a statistical nature, such as those in PCA and other based on fiducial points, such as warping. The evaluation of results is made through recognition sequences by representing the ear with functions.

Iris Recognition in the Visible Spectrum Based on Eye Image Quality Evaluation

ABSTRACT Video-based eye image acquisition in the visible spectrum for iris recognition has taken great importance in the current context of the extensive use of video surveillance cameras and mobile devices. This modality can provide more information from the video capture of the eye region, but it is essential that the images captured have a quality that allows an effective recognition process. In this work, an approach for video iris recognition in the visible spectrum is presented. It is based on a scheme whose novelty is in the possibility of evaluating the quality of the eye image simultaneously with the process of video capturing. A measure of image quality that takes into account the elements defined in the ISO / IEC 19794-6 2005 standard and its combination with automatic detection methods is proposed. The experiments developed on two international databases and own video database demonstrate the relevance of the proposal.

RESUMEN La adquisición de imágenes oculares basadas en video en el espectro visible para el reconocimiento del iris ha cobrado gran importancia en el contexto actual del uso extensivo de cámaras de video vigilancia y dispositivos móviles. Esta modalidad puede proporcionar más información de la región del ojo, pero es esencial que las imágenes capturadas tengan una calidad que permita un proceso de reconocimiento efectivo. En este trabajo, se presenta un enfoque para el reconocimiento de iris en video en el espectro visible. Se basa en un esquema cuya novedad está en la posibilidad de evaluar la calidad de la imagen del ojo simultáneamente con el proceso de captura de video. Se propone una medida de la calidad de imagen que toma en cuenta los elementos definidos en la norma ISO / IEC 19794-6 2005 y su combinación con los métodos de detección automática. Los experimentos desarrollados en dos bases de datos internacionales y una base de datos de video propia demuestran la relevancia de la propuesta.

Evaluation of Acoustic Features for the Automatic Speech Recognition in Noise Scenarios using Kaldi

RESUMEN La presente investigación evaluará el impacto de los Coeficientes Cepstrales en la Frecuencia Mel (MFCC) y los coeficientes Predictores Perceptuales Lineales (PLP), en la tasa de errores de reconocimiento de palabras (WER) de sistemas dedicados al Reconocimiento Automático del Habla (RAH). La experimentación se realizará con señales de voz en idioma español, en escenarios con niveles de ruido desconocidos y utilizando la herramienta del estado del arte Kaldi. El artículo concluye aportando evidencias a favor de los MFCC como rasgo acústico más robusto ante la tarea del RAH en escenarios ruidosos con respecto a los PLP; haciendo notar que ambos rasgos se comportar de manera similar en escenarios poco ruidosos y el impacto de los PLP en la reducción de los tiempos empleados por los sistemas dedicados al RAH.

ABSTRACT The present investigation will evaluate the impact of Mel Frequency Cepstral Coefficients (MFCC) and the Perceptual Linear Predictors (PLP) coefficients, in the word error rate (WER) of systems dedicated to Automatic Speech Recognition (ASR). The experimentation will be done with voice signals in Spanish language, in scenarios with unknown noise levels and using the Kaldi state of the art tool. The article concludes by providing evidence in favor of the MFCC as acoustic feature more robust in the task of ASR in noisy scenarios with respect to the PLP; also both features behave similarly in low noise scenarios and the impact of PLP in reducing the time spent by systems dedicated to ASR.

Profile Face Image Frontalization based on landmark points and 3D Generic Elastic Model

ABSTRACT The first step in most face recognition systems is the alignment of the detected faces. When the faces present large pose variations, the alignment process should be able to generate frontal face images. Different methods have been proposed for face frontalization, but in general, they are not able to reconstruct a frontal image from a complete face profile image. In this paper we extend a face frontalization method based on the 3D Generic Elastic Model (3DGEM), in order to be able of recovering frontal faces from profile images. First, it is determined if the image is a right or a left profile. We train a method based on Active Shape Models (ASM) in order to detect landmark points on profile faces. Then a relationship is established between the profile landmark points and the landmarks located in a 3D face model, which is efficiently adjusted to the image and further frontalized. Face symmetry is taken into account for projecting the appearance of the frontalized face image. The proposal was evaluated by frontalizing the facial images in ICB-RW and CFPW databases. We show the importance of the frontalization process in the classification accuracy.

RESUMEN El primer paso en la mayoría de los sistemas de reconocimiento facial, es la alineación de los rostros detectados. Cuando los rostros presentan largas variaciones de pose, el proceso de alineación debe ser capaz de generar rostros frontales. Diferentes métodos han sido propuestos para la frontalización de los rostros, pero la mayoría de estos no son capaces de reconstruir una imagen frontal desde un rostro completamente de perfil. En este trabajo, se extiende un método de frontalización, basado en los Modelos 3D Elásticos Genéricos (3DGEM), con el objetivo de recuperar imágenes frontales a partir de rostros de perfil. Primero, se determina si la imagen corresponde a un rostro de perfil derecho o de perfil izquierdo. Se entrena un Modelo de Forma Activa (ASM) para detectar los puntos característicos en los rostros de perfil. Luego, se establece una relación entre los puntos característicos del perfil y los puntos localizados en el modelo 3D, que es ajustado de manera eficiente a la imagen para ser frontalizada. Se tiene en cuenta la simetría del rostro para proyectar la apariencia del rostro frontalizado. La propuesta es evaluada mediante la frontalización de las imágenes faciales en las bases de datos ICB-RW y CFPW. Se muestra la importancia de la frontalización para el correcto reconocimiento de los rostros.

Obtención de predicados difusos con un enfoque multiobjetivo: comparación de dos variantes

RESUMEN FuzzyPred es un algoritmo de aprendizaje no supervisado de minería de datos, que permite extraer predicados difusos en forma normal a partir de los datos. Este método se utiliza para resolver una tarea descriptiva donde no se conoce a ciencia cierta qué tipo de relaciones se van a encontrar. Se trata de encontrar patrones que describan los datos y sus relaciones. Debido al gran conjunto de soluciones o espacio de búsqueda que puede tener, fue modelado como un problema de optimización, donde se aplican las metaheurísticas como vía de solución para encontrar buenas soluciones. FuzzyPred brinda como resultado un conjunto de predicados, evaluados en cada una de las medidas de calidad, aunque solo optimiza una de estas medidas. Este trabajo analiza vías para enfocar FuzzyPred como un problema de optimización multiobjetivo. Por esto, se introducen en el problema dos de las técnicas principales de optimización multiobjetivo: la técnica basada en Pareto (o multiobjetivo puro) y la de los factores ponderados. Se realiza un estudio experimental comparativo entre ambas técnicas en este problema para conocer la eficacia de estas técnicas. Los resultados en varias bases de datos internacionales demuestran que se obtienen mejores resultados con la técnica multiobjetivo puro.

ABSTRACT FuzzyPred is an unsupervised-learning data-mining algorithm, which allows extracting fuzzy predicates in normal forms from the data. This method is used to solve a descriptive task where it is not known the kind of relationships that are to be found. The goal is to find patterns that describe the data and their relationships. Due to the large set of solutions or search space that may have, it was modeled as an optimization problem, where metaheuristics are applied to find good solutions. FuzzyPred provides as a result a set of predicates, evaluated in each of the quality measures, in spite of the fact that only one of the measures is optimized (truth value). This paper introduces a multiobjective approach for FuzzyPred by using two of the most known multi-objective optimization techniques: Pareto technique (or pure multi-objective) and weighted factors. An experimental study is presented in order to compare the efficacy of both techniques in this problem. The results in several international databases show that better results are obtained by the pure multi-objective technique.

New probabilistic model on graphical authentication

RESUMEN La autenticación es esencial en la seguridad de los modernos servicios digitales de procesamiento de información. Las contraseñas alfanuméricas son las más empleadas, pero poseen debilidades que las hacen vulnerables a diversos ataques basados en modelos probabilísticos. Una de las alternativas es la autenticación gráfica. Los modelos probabilísticos en autenticación gráfica se aplican para estimar la clave más probable a seleccionar, en cada imagen, por el usuario que se va a registrar. En este trabajo se propone un nuevo modelo probabilístico de autenticación gráfica, su principal aporte consiste en que permite cuantificar el grado de autenticidad de cada usuario. Se confirma experimentalmente que el modelo propuesto es efectivo y permite medir en la práctica el nivel de autenticidad de los usuarios autenticados.

ABSTRACT Authentication is essential in the security of modern digital information processing services. Alphanumeric passwords are the most used, but they have weaknesses that make them vulnerable to various attacks based on probabilistic models. One of the alternatives is graphical authentication. The probabilistic models in graphical authentication are applied to estimate the most likely key to be selected in each image by the user to be registered. In this work a new probabilistic model of graphic authentication is proposed, its main contribution is that it allows quantifying the degree of authenticity of each user. It is confirmed experimentally that the proposed model is effective and allows to measure in practice the authenticity level of authenticated users.