SciELO - Scientific Electronic Library Online

 
vol.40 issue3Iris Recognition in the Visible Spectrum Based on Eye Image Quality EvaluationProfile Face Image Frontalization based on landmark points and 3D Generic Elastic Model author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Ingeniería Electrónica, Automática y Comunicaciones

On-line version ISSN 1815-5928

Abstract

RAMIREZ SANCHEZ, José Manuel; MONTALVO BEREAU, Ana Rosa  and  CALVO DE LARA, José Ramón. Evaluación de Rasgos Acústicos para el Reconocimiento Automático del Habla en Escenarios Ruidosos usando Kaldi. EAC [online]. 2019, vol.40, n.3, pp. 51-71.  Epub Sep 08, 2019. ISSN 1815-5928.

La presente investigación evaluará el impacto de los Coeficientes Cepstrales en la Frecuencia Mel (MFCC) y los coeficientes Predictores Perceptuales Lineales (PLP), en la tasa de errores de reconocimiento de palabras (WER) de sistemas dedicados al Reconocimiento Automático del Habla (RAH). La experimentación se realizará con señales de voz en idioma español, en escenarios con niveles de ruido desconocidos y utilizando la herramienta del estado del arte Kaldi. El artículo concluye aportando evidencias a favor de los MFCC como rasgo acústico más robusto ante la tarea del RAH en escenarios ruidosos con respecto a los PLP; haciendo notar que ambos rasgos se comportar de manera similar en escenarios poco ruidosos y el impacto de los PLP en la reducción de los tiempos empleados por los sistemas dedicados al RAH.

Keywords : Reconocimiento Automático del Habla; Rasgos Acústicos; Kaldi.

        · abstract in English     · text in Spanish     · Spanish ( pdf )