Sistema de reconocimiento de voz mediante wavelets, predicción lineal y redes backpropagation
Wavelets, linear prediction and backpropagation networks for speech recognition system
En el presente trabajo se muestra un sistema que combina la utilización de Transformadas de Wavalet (WT, Wavalet Transform), Coeficientes de Predicción Lineal (LPC, Linear Predictive Coding) y Redes Neuronales Artificiales (ANN, Artificial Neural Networks), para reconocer vocales y sílabas en forma independiente del hablante. Usando esta estructura, se propone un software automatizado que, a través de una interfaz, permite a usuarios con dificultades de audición o ausencia total de ésta, la posibilidad de emplearlo en primera instancia como una herramienta inicial de apoyo para el aprendizaje de sílabas. En una primera etapa se incorpora un número reducido de sílabas, en especial las que podrían tener más dificultad para su identificación. Posteriormente se puede ir incorporando una mayor cantidad de sílabas, de tal forma que el sistema pueda ir creciendo. La adición de nuevas sílabas, permitirá luego (a través de la segmentación de palabras en sílabas), la implementación de un sistema mayor para identificar palabras y por consiguiente el aprendizaje del lenguaje hablado.
INTRODUCCIÓN
El trastorno de audición (TA) desde el punto de vista médico se define como: "La falta total o casi total de la audición, que se manifiesta desde el nacimiento o por lo menos antes de que un niño comience a hablar" [1]. Tomando en cuenta esta definición, el TA es una de las pérdidas sensoriales más perjudiciales para el desenvolvimiento social de un ser humano, ya que no solamente impide que una persona pueda escuchar, sino que también le puede imposibilitar hablar correctamente o no hablar [2]. Al quedarse sin audición, un niño no aprende el sistema del lenguaje hablado, luego no puede adquirir las herramientas necesarias para comunicarse adecuadamente, pudiéndose afectar en forma significativa su desarrollo intelectual y su inserción en la sociedad.
Las únicas herramientas que en la actualidad se utilizan para enseñar a personas con TA, son la lectura de labios y el lenguaje de señas. El desarrollo de herramientas multimedia para enseñar el lenguaje hablado, es por tanto una necesidad social de gran importancia. Se considera el estudio y desarrollo de una herramienta que al aplicarse experimentalmente, pueda ayudar a personas con TA a entrenarse en el aprendizaje lenguaje hablado.
Con el propósito de obtener muestras variadas, se tomó hablantes de lengua española de distintos géneros y edades, incluyendo niños. Todos ellos sin TA y procedentes de Chile (país en que reside el estudio).
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:2366 kb