Prototipo de silla de ruedas comandada por voz empleando hmm en un ambiente controlado
Prototype of wheelchair commanded by voice using HMM in a controlled environment
Este artículo presenta el desarrollo de un sistema de reconocimiento de palabras aisladas independiente del locutor, para comandar una silla de ruedas. Cada palabra se codifica mediante las técnicas de Predicción lineal y Cepstrum real, y la etapa de clasificación se realiza mediante Modelos Ocultos de Markov (HMM). A partir de los resultados se generan órdenes a un sistema móvil (silla de ruedas), el cual es comandado en un ambiente controlado.
1. INTRODUCCIÓN
El reconocimiento de voz ha despertado un inusitado interés, tanto en empresas tecnológicas como en universidades. Basta señalar una gran cantidad de diferentes productos de interacción por voz para entender la creciente necesidad: control de acceso, robots industriales, sistemas de ayuda a discapacitados, acceso y navegación por base de datos, operaciones y transacciones comerciales, etc.
El reconocimiento de voz es básicamente un proceso de clasificación de patrones (Faundez, 2001). El objetivo es adquirir un patrón de entrada, en este caso es la señal de voz, y clasificarla como adelante, atrás, izquierda, etc. Los patrones de entrada, pueden ser tratados como palabras, sílabas o fonemas. La principal dificultad del reconocimiento es que la señal de voz es muy variable, debido a la gran cantidad de locutores, diferentes velocidades a la hora de hablar, condiciones acústicas y ambientales, e incluso el estado anímico del locutor.
Un sistema de reconocimiento puede ser clasificado según sus características así: reconocimiento de palabras aisladas, identificación de palabras clave en un discurso continuo, reconocimiento de palabras conectadas, con dependencia o independencia del locutor, según el tamaño del vocabulario y si el reconocedor está en la capacidad de responder en presencia de ruido o solamente en un ambiente controlado. Los sistemas de reconocimiento dependientes del locutor, deben ser entrenados para responder a las características particulares de la voz de una persona, es decir, para un solo locutor. Algunos trabajos en esta área son (Moralejo, 2010) (Alcubierre, 2005), (Cabas, 2004), (Gold, 2011), (Méndez, 2006), (Burton, 1987), (Rabiner, 1989), (Villamil, 2005), en los cuales le da aplicación al procesamiento de voz.
En este proyecto se da a conocer la experiencia en el desarrollo de un prototipo de reconocimiento de palabras aisladas dependiente del locutor. El prototipo fue desarrollado para ser utilizado en el desarrollo e implementación de una silla de ruedas comandada por voz, este prototipo busca una herramienta de ayuda para personas en situación de discapacidad y de esta forma lograr su independencia.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:1376 kb