Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla
Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este tr...
Guardado en:
| Autores principales: | , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2024
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/177182 |
| Aporte de: |
| id |
I19-R120-10915-177182 |
|---|---|
| record_format |
dspace |
| spelling |
I19-R120-10915-1771822025-03-07T20:06:59Z http://sedici.unlp.edu.ar/handle/10915/177182 Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D. 2024-08 2024 2025-03-07T16:50:38Z es Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 119-132 |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos |
| spellingShingle |
Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D. Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| topic_facet |
Ciencias Informáticas Modelos neuronales profundos Trastorno del habla Aumentación de datos |
| description |
Los trastornos del neurodesarrollo afectan las habilidades de percepción y procesamiento del lenguaje en niños de diferentes edades. Las herramientas de diagnóstico asistido por computadora son de vital importancia para la detección temprana de trastornos del habla y el lenguaje en niños. En este trabajo se explora el uso de modelos de aprendizaje profundo para la detección del Trastorno Específico del Lenguaje a partir de la voz. Para esto se comparan dos enfoques que se emplean para alimentar los modelos neuronales: uno en el que se emplean las señales de audio sin procesar, y otro que se alimenta con espectrogramas derivados de esas señales. Se proponen tres modelos neuronales para realizar la clasificación, dos para el primer enfoque de preprocesamiento de datos y uno para el segundo. Los tres modelos emplean un bloque basado en redes neuronales convolucionales para extraer características. El primero usa una capa completamente conectada como clasificador, mientras que los otros dos procesan la información secuencial mediante redes recurrentes y luego clasifican con una red completamente conectada. A su vez, se exploran estrategias de aumentación de datos, como la adición de ruido, estiramiento temporal, corrimiento temporal y cambio de tono, para analizar su impacto en el desempeño de estas propuestas. Los resultados muestran que los modelos que utilizan las señales sin procesar alcanzan las mejores métricas. Además, el uso de las estrategias de aumentación mejora el desempeño de los modelos propuestos. |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D. |
| author_facet |
Kemmerer, Iara Gerard, Matías F. Vignolo, Leandro D. |
| author_sort |
Kemmerer, Iara |
| title |
Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| title_short |
Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| title_full |
Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| title_fullStr |
Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| title_full_unstemmed |
Evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| title_sort |
evaluación de modelos neuronales y estrategias de aumentación de datos para la identificación de trastornos del habla |
| publishDate |
2024 |
| url |
http://sedici.unlp.edu.ar/handle/10915/177182 |
| work_keys_str_mv |
AT kemmereriara evaluaciondemodelosneuronalesyestrategiasdeaumentaciondedatosparalaidentificaciondetrastornosdelhabla AT gerardmatiasf evaluaciondemodelosneuronalesyestrategiasdeaumentaciondedatosparalaidentificaciondetrastornosdelhabla AT vignololeandrod evaluaciondemodelosneuronalesyestrategiasdeaumentaciondedatosparalaidentificaciondetrastornosdelhabla |
| _version_ |
1847925349627723776 |