BiLSTM with CNN Features For HAR in Videos

El reconocimiento de acciones en videos es actualmente un tema de interés en el área de visión por computadora debido a sus potenciales aplicaciones tales como indexación en multimedia, vigilancia en espacios públicos, entre otras. En este trabajo proponemos una arquitectura CNN-BiLSTM. Primero, una...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Orozco, Carlos Ismael, Buemi, María Elena, Berlles, Julio Jacobo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2021
Materias:
CNN
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/141287
Aporte de:
Descripción
Sumario:El reconocimiento de acciones en videos es actualmente un tema de interés en el área de visión por computadora debido a sus potenciales aplicaciones tales como indexación en multimedia, vigilancia en espacios públicos, entre otras. En este trabajo proponemos una arquitectura CNN-BiLSTM. Primero, una red neuronal convolucional VGG16 previamente entrenada extrae las características del video de entrada. Luego, un BiLSTM clasifica el video en una clase en particular. Evaluamos el rendimiento de nuestro sistema utilizando la precisión como métrica de evaluación, obteniendo 40.9% y 78.1% para los conjuntos de datos HMDB-51 y LTCF-101 respectivamente.