En los últimos años, junto con el desarrollo de la inteligencia artificial (IA) y la tecnología de interacción hombre-máquina, se ha solicitado que el reconocimiento y la producción de voz se adapten al rápido desarrollo de la IA y la tecnología hombre-máquina, lo cual necesita mejorar la precisión del reconocimiento mediante la adición de nuevas características, fusionando las características y mejorando los métodos de reconocimiento. Con el objetivo de desarrollar una nueva característica de reconocimiento y su aplicación en el reconocimiento de voz, este artículo presenta un nuevo método para la conversión articulatoria-acústica. En el estudio, hemos convertido características articulatorias (es decir, velocidades de lengua y movimiento de labios) en características acústicas (es decir, el segundo formante y Mel-Cepstra). Al considerar la representación gráfica del movimiento de los articuladores, este estudio combinó la Memoria a Corto y Largo Plazo Bidireccional (BiLSTM) con una red neuronal convolucional (CNN) y adoptó la idea de atención de palabras en mandarín para extraer características semánticas. En este artículo,
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Búsqueda del vecino más cercano de índice de árbol de objetos móviles a lo largo de una red de carreteras
Artículo:
Desarrollo y Aplicación de Big Data en el Campo de la Navegación por Satélite
Artículo:
Estudio sobre la reducción de tipo de centroide de sistemas lógicos difusos de tipo 2 basados en algoritmos no iterativos.
Artículo:
Modelo matemático de evaluación del rendimiento del cortafuegos de red móvil basado en colas
Artículo:
Evaluación de confiabilidad para subestación inteligente ciberfísica.