Este artículo presenta el desarrollo de un sistema de reconocimiento de palabras aisladas independiente del locutor, para comandar una silla de ruedas. Cada palabra se codifica mediante las técnicas de Predicción lineal y Cepstrum real, y la etapa de clasificación se realiza mediante Modelos Ocultos de Markov (HMM). A partir de los resultados se generan órdenes a un sistema móvil (silla de ruedas), el cual es comandado en un ambiente controlado.
1. INTRODUCCIÓN
El reconocimiento de voz ha despertado un inusitado interés, tanto en empresas tecnológicas como en universidades. Basta señalar una gran cantidad de diferentes productos de interacción por voz para entender la creciente necesidad: control de acceso, robots industriales, sistemas de ayuda a discapacitados, acceso y navegación por base de datos, operaciones y transacciones comerciales, etc.
El reconocimiento de voz es básicamente un proceso de clasificación de patrones (Faundez, 2001). El objetivo es adquirir un patrón de entrada, en este caso es la señal de voz, y clasificarla como adelante, atrás, izquierda, etc. Los patrones de entrada, pueden ser tratados como palabras, sílabas o fonemas. La principal dificultad del reconocimiento es que la señal de voz es muy variable, debido a la gran cantidad de locutores, diferentes velocidades a la hora de hablar, condiciones acústicas y ambientales, e incluso el estado anímico del locutor.
Un sistema de reconocimiento puede ser clasificado según sus características así: reconocimiento de palabras aisladas, identificación de palabras clave en un discurso continuo, reconocimiento de palabras conectadas, con dependencia o independencia del locutor, según el tamaño del vocabulario y si el reconocedor está en la capacidad de responder en presencia de ruido o solamente en un ambiente controlado. Los sistemas de reconocimiento dependientes del locutor, deben ser entrenados para responder a las características particulares de la voz de una persona, es decir, para un solo locutor. Algunos trabajos en esta área son (Moralejo, 2010) (Alcubierre, 2005), (Cabas, 2004), (Gold, 2011), (Méndez, 2006), (Burton, 1987), (Rabiner, 1989), (Villamil, 2005), en los cuales le da aplicación al procesamiento de voz.
En este proyecto se da a conocer la experiencia en el desarrollo de un prototipo de reconocimiento de palabras aisladas dependiente del locutor. El prototipo fue desarrollado para ser utilizado en el desarrollo e implementación de una silla de ruedas comandada por voz, este prototipo busca una herramienta de ayuda para personas en situación de discapacidad y de esta forma lograr su independencia.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Evaluación mediante micro-TC de cuatro técnicas de obturación del conducto radicular
Artículo:
Un nuevo conjunto de antenas UWB miniaturizadas de doble polarización oblicua con una excelente propiedad de simetría de patrón para aplicaciones MIMO
Artículo:
Técnica de formación de haz angular para un sistema de formación de haz MIMO
Artículo:
Antena EBG de bajo perfil con gran apertura angular y polarización circular
Artículo:
Diseño de una antena bidireccional de doble banda utilizando un anillo rectangular alimentado por un monopolo para aplicaciones IEEE 802.11 a/b/g/n
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Los web services como herramienta generadora de valor en las organizaciones
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Libro:
Ergonomía en los sistemas de trabajo