Detección de palabras claves en lenguajes sin datos de entrenamiento
Estudiamos el problema de detección de palabras claves (<i>key-word-spotting</i>) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla....
Autores principales: | , , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2014
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/42287 |
Aporte de: |
id |
I19-R120-10915-42287 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas keyword-spotting automatic speech recognition hidden Markov models speech data mining |
spellingShingle |
Ciencias Informáticas keyword-spotting automatic speech recognition hidden Markov models speech data mining Brusco, Pablo Ferrer, Luciana Gravano, Agustín Detección de palabras claves en lenguajes sin datos de entrenamiento |
topic_facet |
Ciencias Informáticas keyword-spotting automatic speech recognition hidden Markov models speech data mining |
description |
Estudiamos el problema de detección de palabras claves (<i>key-word-spotting</i>) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla. Usando el Boston University Radio Speech Corpus como corpus de referencia, analizamos diversas topologías y parametrizaciones de Modelos Ocultos de Markov para la detección de palabras sobre habla continua. Los modelos se basan en el uso de "fillers" para palabras no buscadas, y empleamos fonemas como unidades mínimas de detección. Para las pruebas, utilizamos un conjunto de 20 keywords entrenadas con 14 minutos de datos transcriptos y fillers entrenados con 7 horas sin transcripciones. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1% y 3.95 falsas alarmas por hora por keyword. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Brusco, Pablo Ferrer, Luciana Gravano, Agustín |
author_facet |
Brusco, Pablo Ferrer, Luciana Gravano, Agustín |
author_sort |
Brusco, Pablo |
title |
Detección de palabras claves en lenguajes sin datos de entrenamiento |
title_short |
Detección de palabras claves en lenguajes sin datos de entrenamiento |
title_full |
Detección de palabras claves en lenguajes sin datos de entrenamiento |
title_fullStr |
Detección de palabras claves en lenguajes sin datos de entrenamiento |
title_full_unstemmed |
Detección de palabras claves en lenguajes sin datos de entrenamiento |
title_sort |
detección de palabras claves en lenguajes sin datos de entrenamiento |
publishDate |
2014 |
url |
http://sedici.unlp.edu.ar/handle/10915/42287 |
work_keys_str_mv |
AT bruscopablo detecciondepalabrasclavesenlenguajessindatosdeentrenamiento AT ferrerluciana detecciondepalabrasclavesenlenguajessindatosdeentrenamiento AT gravanoagustin detecciondepalabrasclavesenlenguajessindatosdeentrenamiento |
bdutipo_str |
Repositorios |
_version_ |
1764820473522159621 |