Aprendizaje multiclase de videoimágenes deportivas con arquitecturas profundas

Las arquitecturas profundas permiten representar de manera compacta funciones altamente no lineales. Entre ellas, las redes convolucionales han adquirido gran protagonismo en la clasificación de imágenes debido a la invarianza traslacional de sus features. Este trabajo propone investigar un abordaje...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Escarrá, Martín
Otros Autores: Grinblat, Guillermo
Formato: bachelorThesis tesis de grado publishedVersion
Lenguaje:Español
Publicado: Facultad de Ciencias Exactas, Ingeniería y Agrimensura. Universidad Nacional de Rosario 2016
Materias:
Acceso en línea:http://www.fceia.unr.edu.ar/lcc/t523/tesina.php?campo1=90
http://hdl.handle.net/2133/6552
http://hdl.handle.net/2133/6552
Aporte de:
Descripción
Sumario:Las arquitecturas profundas permiten representar de manera compacta funciones altamente no lineales. Entre ellas, las redes convolucionales han adquirido gran protagonismo en la clasificación de imágenes debido a la invarianza traslacional de sus features. Este trabajo propone investigar un abordaje naïve para la clasificación de videoimágenes con redes profundas, comparar la performance de redes pre-entrenadas con la de redes ad-hoc y finalmente crear un mecanismo de visualización de la representación interna de la arquitectura. Como ejemplo de aplicación se utilizarán segmentos de videos deportivos con diferentes acciones grupales.