Este trabajo da a conocer el sistema de desarrollo de software para el diseño y manipulación de modelos ocultos de Markov, denominado HTK. Actualmente, la técnica de modelos ocultos de Markov es la herramienta más efectiva para implementar sistemas reconocedores del habla. HTK está orientado principalmente a ese aspecto. Su arquitectura es robusta y autosuficiente. Permite: La entrada lógica y natural desde un micrófono, dispone de módulos para la conversiónA/D, pre procesado y parametrización de la información, posee herramientas para definir y manipular modelos ocultos de Markov, tiene librerías para entrenamiento y manipulación de los modelos ocultos de Markov ya definidos, considera funciones para definir la gramática y, además, una serie de herramientas adicionales para lograr el objetivo final de obtener una hipotética transcripción del habla (conversión voz-texto).
INTRODUCCIÓN
Los sistemas más exitosos en el área de reconocimiento automático del habla (ASR: Automatic Speech Recognition), se basan en la utilización de la técnica de análisis estocástico: Modelos Ocultos de Markov (HMM: Hidden Markov Models) [3, 8]. La implementación de un sistema ASR no es una tarea cómoda para los investigadores, debido principalmente al alto grado de complejidad que alcanza este tipo de problema [3-5]. El principal obstáculo se refiere al manejo de grandes bases de datos (archivos, parámetros, modelos, diccionarios). Sin una herramienta computacional efectiva, los objetivos serán limitados, y hasta obstaculizadores para continuar con el desarrollo del estado del arte.
HTK, Hidden Markov Model Toolkit [1, 2 y 4]. Es un conjunto de herramientas de software para diseñar y manipular HMM. Originalmente fue creado para aplicarlo al desarrollo de sistemas ASR. Ahora puede utilizarse en cualquier área del conocimiento, la única restricción es que el problema a resolver pueda ser enfocado como un proceso de modelación Estocástico Markoviano. En la actualidad es exitosamente utilizado en: Reconocimiento y síntesis de voz, reconocimiento de caracteres y formas gráficas, análisis de vibraciones mecánicas. Incluso ha sido usado con éxito en determinar secuencias válidas del ADN humano (Proyecto Genoma). Según sea el grado de complejidad de nuestro problema (nivel al que se diseñen los HMM), HTK resulta adaptable al tipo y formato de dato ha utilizar y permite el diseño de diferentes tipos de reconocedores.
El desarrollo de HTK lo lleva a cabo el grupo del habla, visión y robótica del Departamento de Ingeniería de la Universidad de Cambridge (CUED), UK. Actualmente HTK es de libre distribución y su código y librería pueden ser modificados en común acuerdo con el CUED. Además la herramienta se encuentra disponible para utilizarlo en diversas plataformas o sistemas operativos, tales como: Unix, Linux, Windows XP y DOS.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Hacia sistemas heterogéneos de detección de anomalías a gran escala en redes industriales: Un estudio de las tendencias actuales
Artículo:
Red neuronal convolucional multientrada para la clasificación de flores
Artículo:
Esquema de auditoría pública basado en la identidad para el almacenamiento en la nube con fuerte resistencia a la exposición de claves
Artículo:
Planificación de la ampliación de la red de transporte considerando transformadores desfasadores
Artículo:
Investigación sobre la predicción del rendimiento deportivo basada en la red neuronal BP
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
La gestión de las relaciones con los clientes como característica de la alta rentabilidad empresarial
Artículo:
Análisis socioeconómico de la problemática de los desechos plásticos en el mar
Artículo:
Los web services como herramienta generadora de valor en las organizaciones