Diseño y manipulación de modelos ocultos de Markov, utilizando herramientas HTK: una tutoría
Design and manipulation of hidden Markov models using HTK tools. A tutorial
Este trabajo da a conocer el sistema de desarrollo de software para el diseño y manipulación de modelos ocultos de Markov, denominado HTK. Actualmente, la técnica de modelos ocultos de Markov es la herramienta más efectiva para implementar sistemas reconocedores del habla. HTK está orientado principalmente a ese aspecto. Su arquitectura es robusta y autosuficiente. Permite: La entrada lógica y natural desde un micrófono, dispone de módulos para la conversiónA/D, pre procesado y parametrización de la información, posee herramientas para definir y manipular modelos ocultos de Markov, tiene librerías para entrenamiento y manipulación de los modelos ocultos de Markov ya definidos, considera funciones para definir la gramática y, además, una serie de herramientas adicionales para lograr el objetivo final de obtener una hipotética transcripción del habla (conversión voz-texto).
INTRODUCCIÓN
Los sistemas más exitosos en el área de reconocimiento automático del habla (ASR: Automatic Speech Recognition), se basan en la utilización de la técnica de análisis estocástico: Modelos Ocultos de Markov (HMM: Hidden Markov Models) [3, 8]. La implementación de un sistema ASR no es una tarea cómoda para los investigadores, debido principalmente al alto grado de complejidad que alcanza este tipo de problema [3-5]. El principal obstáculo se refiere al manejo de grandes bases de datos (archivos, parámetros, modelos, diccionarios). Sin una herramienta computacional efectiva, los objetivos serán limitados, y hasta obstaculizadores para continuar con el desarrollo del estado del arte.
HTK, Hidden Markov Model Toolkit [1, 2 y 4]. Es un conjunto de herramientas de software para diseñar y manipular HMM. Originalmente fue creado para aplicarlo al desarrollo de sistemas ASR. Ahora puede utilizarse en cualquier área del conocimiento, la única restricción es que el problema a resolver pueda ser enfocado como un proceso de modelación Estocástico Markoviano. En la actualidad es exitosamente utilizado en: Reconocimiento y síntesis de voz, reconocimiento de caracteres y formas gráficas, análisis de vibraciones mecánicas. Incluso ha sido usado con éxito en determinar secuencias válidas del ADN humano (Proyecto Genoma). Según sea el grado de complejidad de nuestro problema (nivel al que se diseñen los HMM), HTK resulta adaptable al tipo y formato de dato ha utilizar y permite el diseño de diferentes tipos de reconocedores.
El desarrollo de HTK lo lleva a cabo el grupo del habla, visión y robótica del Departamento de Ingeniería de la Universidad de Cambridge (CUED), UK. Actualmente HTK es de libre distribución y su código y librería pueden ser modificados en común acuerdo con el CUED. Además la herramienta se encuentra disponible para utilizarlo en diversas plataformas o sistemas operativos, tales como: Unix, Linux, Windows XP y DOS.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:175 kb