Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos

El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en l...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Rios, Gastón Gustavo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/173140
Aporte de:
id I19-R120-10915-173140
record_format dspace
spelling I19-R120-10915-1731402024-11-19T04:02:04Z http://sedici.unlp.edu.ar/handle/10915/173140 Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos Automatic Video Generation Using Deep Learning: Application in Dynamic Gesture Recognition Rios, Gastón Gustavo 2024-11-20 2024 2024-11-15T21:22:52Z es Cs de la Computación Reconocimiento de Lengua de Señas Aprendizaje Profundo Modelos Generativos Aumentacion de Datos Datos Limitados sign language recognition deep learning generative models data augmentation limited data El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados. Carrera: Doctorado en Ciencias Informaticas Lugar de trabajo: Instituto de Investigación en Informática (III-LIDI) Organismo: UNLP Año de inicio de beca: 2020 Año de finalización de beca: 2025 Apellido, Nombre del Director/a/e: Ronchetti, Franco Apellido, Nombre del Codirector/a/e: Quiroga, Facundo Lugar de desarrollo: Instituto de Investigación en Informática (III-LIDI) Áreas de conocimiento: Cs de la Computación Tipo de investigación: Aplicada Facultad de Informática Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
spellingShingle Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
Rios, Gastón Gustavo
Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
topic_facet Cs de la Computación
Reconocimiento de Lengua de Señas
Aprendizaje Profundo
Modelos Generativos
Aumentacion de Datos
Datos Limitados
sign language recognition
deep learning
generative models
data augmentation
limited data
description El objetivo general de esta beca es la creación de modelos capaces de generar videos artificiales. Estos modelos resultan sumamente útiles en contextos donde se requiere aumentar la cantidad de datos disponibles, en particular aquellas bases de datos con pocos ejemplos. El énfasis estará puesto en la generación de videos de gestos dinámicos, permitiendo de esta forma entrenar modelos de Deep Learning eficientes a partir de pocos datos reales.Como objetivos específicos se proponen los siguientes:a. Estudio y análisis de bases de datos públicas sobre reconocimiento de gestos, incluyendo bases de datos específicas para lengua de señas. Particularmente LSA64, base de datos para la lengua de señas argentina desarrollada en el III-LIDI.b. Creación de nuevos modelos de generación de videos que posean coherencia temporal para complementar las bases de datos existentes. Particularmente se estudiarán las Generative Adversarial Networks (GAN) ya que son los modelos más utilizados en el estado del arte.c. Desarrollo de modelos clasificadores de videos aplicado al reconocimiento de gestos dinámicos. Particularmente, se estudiarán Redes Neuronales Convolucionales (ConvNets) y Redes Neuronales Recurrentes (específicamente LSTM) específicas para problemas de clasificación de objetos en videos.d. Aplicación de los clasificadores desarrollados en el dominio del reconocimiento de gestos dinámicos y la lengua de señas.e. Análisis y comparación de los resultados obtenidos utilizando los nuevos datos generados.
format Objeto de conferencia
Objeto de conferencia
author Rios, Gastón Gustavo
author_facet Rios, Gastón Gustavo
author_sort Rios, Gastón Gustavo
title Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_short Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_full Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_fullStr Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_full_unstemmed Generación automática de videos utilizando Deep Learning. Aplicación en reconocimiento de gestos dinámicos
title_sort generación automática de videos utilizando deep learning. aplicación en reconocimiento de gestos dinámicos
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/173140
work_keys_str_mv AT riosgastongustavo generacionautomaticadevideosutilizandodeeplearningaplicacionenreconocimientodegestosdinamicos
AT riosgastongustavo automaticvideogenerationusingdeeplearningapplicationindynamicgesturerecognition
_version_ 1827812757482766336