Un nuevo modelo para la estimación de bi-gramas en reconocimiento del habla

Se presenta un nuevo método para el suavizado de N-gramas utilizando regularización en un modelo de máxima entropía. Dicha regularización se efectúa introduciendo un término en la función objetivo al estilo de las máquinas de soporte vectorial. Relacionado con dicho término se incluye una variable q...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Estienne, Claudio Francisco
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2010
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/152807
http://39jaiio.sadio.org.ar/sites/default/files/39jaiio-asai-06.pdf
Aporte de:
Descripción
Sumario:Se presenta un nuevo método para el suavizado de N-gramas utilizando regularización en un modelo de máxima entropía. Dicha regularización se efectúa introduciendo un término en la función objetivo al estilo de las máquinas de soporte vectorial. Relacionado con dicho término se incluye una variable que actúa como descuento de probabilidades en el estimador, similar al usado en otros métodos de suavizado de modelos de lenguaje, pero considerando dicho descuento como otra variable a optimizar. El modelo fue evaluado en una tarea de reconocimiento de habla usando modelos de lenguaje de bi-gramas. Los resultados se testaron usando la base de datos Latino-40 midiendo perplejidad y porcentaje de palabras reconocidas. Los resultados fueron significativamente superiores a un modelo que es estado del arte.