Detección de palabras claves en lenguajes sin datos de entrenamiento

Estudiamos el problema de detección de palabras claves (<i>key-word-spotting</i>) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla....

Descripción completa

Detalles Bibliográficos
Autores principales: Brusco, Pablo, Ferrer, Luciana, Gravano, Agustín
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2014
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/42287
Aporte de:
id I19-R120-10915-42287
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
keyword-spotting
automatic speech recognition
hidden Markov models
speech data mining
spellingShingle Ciencias Informáticas
keyword-spotting
automatic speech recognition
hidden Markov models
speech data mining
Brusco, Pablo
Ferrer, Luciana
Gravano, Agustín
Detección de palabras claves en lenguajes sin datos de entrenamiento
topic_facet Ciencias Informáticas
keyword-spotting
automatic speech recognition
hidden Markov models
speech data mining
description Estudiamos el problema de detección de palabras claves (<i>key-word-spotting</i>) para idiomas que no disponen de corpus de datos con grabaciones y transcripciones fonéticas. Este problema es de central importancia para poder realizar búsquedas en bases de datos de grabaciones de habla. Usando el Boston University Radio Speech Corpus como corpus de referencia, analizamos diversas topologías y parametrizaciones de Modelos Ocultos de Markov para la detección de palabras sobre habla continua. Los modelos se basan en el uso de "fillers" para palabras no buscadas, y empleamos fonemas como unidades mínimas de detección. Para las pruebas, utilizamos un conjunto de 20 keywords entrenadas con 14 minutos de datos transcriptos y fillers entrenados con 7 horas sin transcripciones. Los resultados muestran que el mejor modelo alcanza rendimientos superiores a un 0.47 de FOM promedio, un porcentaje de detecciones correctas del 72.1% y 3.95 falsas alarmas por hora por keyword.
format Objeto de conferencia
Objeto de conferencia
author Brusco, Pablo
Ferrer, Luciana
Gravano, Agustín
author_facet Brusco, Pablo
Ferrer, Luciana
Gravano, Agustín
author_sort Brusco, Pablo
title Detección de palabras claves en lenguajes sin datos de entrenamiento
title_short Detección de palabras claves en lenguajes sin datos de entrenamiento
title_full Detección de palabras claves en lenguajes sin datos de entrenamiento
title_fullStr Detección de palabras claves en lenguajes sin datos de entrenamiento
title_full_unstemmed Detección de palabras claves en lenguajes sin datos de entrenamiento
title_sort detección de palabras claves en lenguajes sin datos de entrenamiento
publishDate 2014
url http://sedici.unlp.edu.ar/handle/10915/42287
work_keys_str_mv AT bruscopablo detecciondepalabrasclavesenlenguajessindatosdeentrenamiento
AT ferrerluciana detecciondepalabrasclavesenlenguajessindatosdeentrenamiento
AT gravanoagustin detecciondepalabrasclavesenlenguajessindatosdeentrenamiento
bdutipo_str Repositorios
_version_ 1764820473522159621