Ficha técnica

332 | 4

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Artículos

Time-Frequency Energy Features for Articulator Position Inference on Stop ConsonantsCaracterísticas de tiempo-frecuencia para la estimación de la posición de los órganos articuladores en consonantes explosivas

Resumen

La inversión articulatoria ofrece nuevas perspectivas y aplicaciones interesantes en el campo de la voz; sin embargo, es aún un problema por resolver. El presente trabajo ofrece un método para la estimación de la distribución de la información articulatoria contenida en la acústica de consonantes explosivas, cuya parametrización se realiza mediante la transformada wavelet packet. El trabajo se centra principalmente en estimar la información acústica relevante, en términos de asociación estadística, para la inferencia de la posición de los órganos articuladores críticos involucrados en la producción de consonantes explosivas. Se usa el coeficiente de Kendall a modo de medida de relevancia. Los mapas de relevancia de tiempo-frecuencia se calculan para la base de datos MOCHA–TIMIT; de la cual, las zonas correspondientes a las consonantes explosivas son analizados. El método propuesto entrega un conjunto de componentes de tiempo-frecuencia intimamente relacionados al fenómeno articulatorio, lo cual ofrece un entendimiento más profundo de la relación existente entre los fenómenos articulatorio y acústico. Los mapas de relevancia se prueban en un sistema de inversión articulatoria basado en modelos de mezclas gausianas, donde se muestra que mejoran el desempeño de los mencionados sistemas aplicados sobre consonantes explosivas. El método se puede extender a otras categorías articulatorias, p.e. fricativas, con el fin de adaptar el presente método a sistemas de inversión articulatoria sobre voz continua.

1 INTRODUCCIÓN

La inferencia de la posición de los articuladores, a partir de la información acústica contenida en la señal del habla, ofrece nuevas perspectivas e interesantes aplicaciones en el campo del procesamiento del habla. Un sistema adecuado para recuperar las configuraciones articulatorias, a partir de la señal acústica del habla, podría utilizarse en varias aplicaciones: ayudas visuales en tareas de entrenamiento articulatorio para personas con problemas de audición o de habla; programas de aprendizaje de segundas lenguas guiados por ordenador para mostrar la pronunciación correcta e incorrecta [1]; codificación de baja tasa de bits, ya que los articuladores se mueven de forma relativamente lenta [2]; y representación complementaria en los sistemas de reconocimiento del habla para mejorar su rendimiento, ya que los parámetros articulatorios representan mejor los fenómenos relacionados con la coarticulación [3].

Los gestos del habla son movimientos planificados en una secuencia coordinada, cuyas acciones son relativamente lentas y se solapan.

Materias:Propagación de ondas acústicas Espectros de frecuencia Ecuaciones Voz
Subjects:Sound wave propagation Frequency spectra Equations Voice
Palabras claves:Inversión articulatoria; Modelos de mezclas Gaussianas; Fonética articulatoria; Características de tiempo-frecuencia.
Keywords:Acoustic-to-Articulatory inversion; Gaussian mixture models; Articulatory phonetics; Time-frequency features.

Autor:Castellanos-Domínguez, German Sepulveda-Sepulveda, Alexander.
Categoría:Ciencias aplicadas e interdisciplinarias
Subcategoría:Ingeniería electrónica y afines
Año de publicación:2012.
Editor:Universidad EAFIT

Tipo de documento:
Formato:pdf
Idioma:Inglés
Tamaño:354 Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no estï¿½ disponible para su tipo de suscripciï¿½n

DC.Title.spa

Time-Frequency Energy Features for Articulator Position Inference on Stop Consonants

DC.Title.eng

Características de tiempo-frecuencia para la estimación de la posición de los órganos articuladores en consonantes explosivas

DC.Creator

Castellanos-Domínguez, German Sepulveda-Sepulveda, Alexander

DC.Subject.snpi.spa

Propagación de ondas acústicas Espectros de frecuencia Ecuaciones Voz

DC.Subject.snpi.eng

Sound wave propagation Frequency spectra Equations Voice

DC.Subject.spa

Inversión articulatoria; Modelos de mezclas Gaussianas; Fonética articulatoria; Características de tiempo-frecuencia.

DC.Subject.eng

Acoustic-to-Articulatory inversion; Gaussian mixture models; Articulatory phonetics; Time-frequency features.

DC.Description.spa

1 INTRODUCCIÓN

Los gestos del habla son movimientos planificados en una secuencia coordinada, cuyas acciones son relativamente lentas y se solapan.

DC.Source

https://publicaciones.eafit.edu.co/index.php/ingciencia/article/view/1705/1926

DC.Identifier.virtualpro

http://www.revistavirtualpro.com/biblioteca/caracteristicas-de-tiempo-frecuencia-para-la-estimacion-de-la-posicion-de-los-organos-articuladores-en-consonantes-explosivas

DC.Identifier.issn-isbn

ISSN:2256-4314 (Versión electrónica); 1794-9165 (Versión impresa)

DC.Identifier.citacion

Revista Virtual Pro, Julio 2012, Ingeniería y Ciencia Vol. 8 No. 16

DC.Language

Inglés

DC.Relation

DC.Publisher

Universidad EAFIT

DC.Contributor

DC.Rights

Derechos de autor:1

DC.Date

2012

DC.Type

Artículos

DC.Format

pdf

DC.Identifier.file

24325.pdf

Ficha técnica
Metadata
Imprimir
Descargar
Reportar error

Información del documento

Titulo:Time-Frequency Energy Features for Articulator Position Inference on Stop Consonants
Autor:Sepulveda-Sepulveda, Alexander; Castellanos-Domínguez, German
Tipo:Artículos
Año:2012
Idioma:Inglés
Editor:Universidad EAFIT
Materias:Propagación de ondas acústicas Espectros de frecuencia Ecuaciones Voz
Descarga:4