Segmentación automática de noticias mediante procesamiento de formas prosódicas
Automatic segmentation of news through prosodic forms processing
La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las formas prosódicas típicas del discurso informativo y se intentan programar mediante el procesamiento cepstrum en el entorno Labview. Después de numerosas pruebas se fijan los diferentes parámetros de procesamiento y estilización de la curva macromelódica basada en los máximos de pitch (parábolas). Se formula un algoritmo de segmentación automática de noticias a partir de la detección de pausas y el análisis de formas prosódicas de inicio y final de noticia. Sobre una muestra de cinco informativos reales emitidos en el canal español Cuatro en julio de 2009, el entorno detecta 98 pausas y etiqueta correctamente (corte/no corte) el 76% de las mismas. La totalidad de los cortes estaban contenidos en las 98 pausas localizadas, de los cuales el algoritmo pasa por alto 9 y genera 15 errores de cortes mal emplazados. Tanto la lingüística computacional como el procesamiento del habla pueden tener un importante margen de mejora si también se asume la perspectiva comunicológica: agrupar datos acústicos como variables complejas asociadas a cada acto de comunicación. Para futuros trabajos, este algoritmo puede ser mejorado si se complementa con sistemas de identificación de locutores, discriminación de ruidos y word spotting.
INTRODUCCIÓN
El habla de los informativos de televisión, planificada con el objetivo de parecer espontánea, responde a un tipo discursivo propio de gran estabilidad y estandarización. De forma específica, la unidad discursiva noticia tiene una caracterización supralingüística o prosódica que la hace reconocible más allá de su contenido: la parte sintáctica y léxica (idiomática) y la semántica del evento y su temática. La melodía del habla de los informativos los hace reconocibles en francés, portugués, catalán o español, sin necesidad de entenderlos, independientemente del hecho noticioso y su temática, y sin la ayuda de las imágenes o de otros elementos sonoros no vocales (músicas, efectos o rasgos no verbales del habla). Sobre este supuesto teórico se postuló, en el marco de un proyecto de investigación financiado por el CAC (Consell de l´Audiovisual de Catalunya) y la tesis doctoral del autor [1], que mediante las variaciones prosódicas suprasegmentales era posible la segmentación automática de las unidades noticia en el continuum del discurso informativo en televisión.
Nuestro objeto de estudio eran pues las variaciones de tono, ritmo e intensidad en el habla del presentador de informativos propias de la enunciación de la noticia como unidad discursiva.
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:178 kb