Biblioteca122.739 documentos en línea

Artículo

Multitask Learning with Local Attention for Tibetan Speech RecognitionAprendizaje multitarea con atención local para el reconocimiento de voz en tibetano

Resumen

En este documento, proponemos incorporar la atención local en WaveNet-CTC para mejorar el rendimiento del reconocimiento del habla tibetana en el aprendizaje multitarea. Con un aumento en el número de tareas, como el reconocimiento simultáneo de contenido del habla tibetana, identificación de dialecto y reconocimiento de hablante, la tasa de precisión de un solo WaveNet-CTC disminuye en el reconocimiento del habla. Inspirados por el mecanismo de atención, introducimos la atención local para ajustar automáticamente los pesos de los marcos de características en una ventana y prestar diferente atención a la información de contexto para el aprendizaje multitarea. Los resultados experimentales muestran que nuestro método mejora las precisiones del reconocimiento del habla para todos los dialectos tibetanos en el aprendizaje de tres tareas, en comparación con el modelo base. Además, nuestro método mejora significativamente la precisión para el dialecto de recursos limitados en un 5.11% en comparación con el modelo de dialecto específico.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento