Cálculo y análisis del pitch en señales sonoras de voz humana

El análisis del pitch involucra diferentes tópicos dentro del estudio de señales sonoras aún no explorados completamente. En virtud de la imprecisión en su propia definición se pueden implementar una gran variedad de algoritmos para su adquisición. Históricamente se ha definido al pitch como la fre...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Wainschenker, Rubén, Doorn, Jorge Horacio, Castro, Marcelo, Legrottaglie, C. F.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2003
Materias:
Voz
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/21513
Aporte de:
Descripción
Sumario:El análisis del pitch involucra diferentes tópicos dentro del estudio de señales sonoras aún no explorados completamente. En virtud de la imprecisión en su propia definición se pueden implementar una gran variedad de algoritmos para su adquisición. Históricamente se ha definido al pitch como la frecuencia fundamental de espectro de frecuencias del habla [Casacuberta87] y se lo ha asociado al movimiento que realiza la glotis en la generación del sonido [Husson62]. Desafortunadamente cualquiera sea la forma en la que se lo defina no se ajustará a la realidad, porque la oscilación glotal es una función cuasi-periódica [Klatt87]. Además, esta frecuencia no es fácilmente identificable debido a que en algunas situaciones prácticamente desaparece de la onda sonora. Esto ocurre cuando las articulaciones del tracto vocal hacen que la energía del sonido se concentre en algunos de sus armónicos. No obstante no se lo pierde completamente y se puede utilizar dichos armónicos para su rastreo. Se ha observado que esta vibración no es constante a lo largo del discurso, detectándose variaciones a lo largo de la frase y también dentro mismo de una palabra. Estas variaciones se deben tanto a la entonación de la frase, como a la acentuación de los fonemas así como al estado emocional del orador [Rocha87] [Klatt87].