Redes GANs como técnica de data augmentation para el reconocimiento de lengua de señas

En los últimos años las Redes Generativas Adversas han sido un tema de vanguardia dentro del campo del Aprendizaje Profundo. Por otra parte, es de común conocimiento que la cantidad de conjuntos de datos disponibles hoy en día no ha alcanzado todas las problemáticas existentes. En esta tesis se expl...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Gaggiotti, William
Otros Autores: Ronchetti, Franco
Formato: Tesis Tesis de grado
Lenguaje:Español
Publicado: 2021
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/129860
Aporte de:
Descripción
Sumario:En los últimos años las Redes Generativas Adversas han sido un tema de vanguardia dentro del campo del Aprendizaje Profundo. Por otra parte, es de común conocimiento que la cantidad de conjuntos de datos disponibles hoy en día no ha alcanzado todas las problemáticas existentes. En esta tesis se explora el uso de GANs para la generación de imágenes sintéticas de la lengua de señas en los dataset LSA16 y ASL Finger Spelling. Posteriormente se utilizan las mismas para realizar data augmentation con el fin aumentar la precisión en la clasificación de señas estáticas, logrando una mejora del ~2% para el conjunto de datos LSA16 y ~4% para el conjunto de datos de ASL Finger Spelling. Estos resultados se obtuvieron con el uso de BigGAN, el modelo GAN que logró generar las imágenes de más alta fidelidad a la vez que mantuvo una gran diversidad en sus muestras.