Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático

El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandari...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Esnaola, Leonardo, Tessore, Juan Pablo, Ramón, Hugo, Russo, Claudia
Otros Autores: 0000-0001-6298-9019
Formato: Documento de conferencia acceptedVersion
Lenguaje:Español
Publicado: IEEE 2021
Materias:
Acceso en línea:https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140
Aporte de:
id I103-R405-23601-140
record_format dspace
spelling I103-R405-23601-1402025-10-17T21:27:38Z Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia 0000-0001-6298-9019 0000-0002-2111-0976 0000-0003-1577-3092 Normalización léxica Minería de textos Análisis de sentimientos Aprendizaje automático El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandarización de los textos. Esto último tiene por finalidad, mejorar la exactitud final de la tarea de clasificación antes mencionada. En este trabajo se definen y ejecutan una serie de tareas de limpieza sobre un dataset de comentarios extraídos de la red social Facebook. El objetivo es verificar si las correcciones realizadas por dichas tareas, se traducen en una mejora significativa en la exactitud alcanzada por el algoritmo de clasificación. Los resultados obtenidos indican que, sobre este tipo de dataset, tareas de preprocesamiento con un desempeño razonablemente bueno en lo que se refiere a corrección de errores, no necesariamente conducen a una mejora notoria en la exactitud de la clasificación de los textos. Fil: Esnaola, Leonardo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Tessore, Juan Pablo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Tessore, Juan Pablo. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Fil: Ramón, Hugo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Ramón, Hugo. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Fil: Russo, Claudia. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Russo, Claudia. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Con referato 2021-07-26T13:17:10Z 2021-07-26T13:17:10Z 2019-09-30 info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion L. Esnaola, J. P. Tessore, H. Ramón and C. Russo, "Effectiveness of preprocessing techniques over social media texts for the improvement of machine learning based classifiers," 2019 XLV Latin American Computing Conference (CLEI), 2019, pp. 1-10, doi: 10.1109/CLEI47609.2019.235076. 978-1-7281-5574-6 978-1-7281-5575-3 (Impresión bajo demanda (PoD)) https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140 spa info:eu-repo/grantAgreement/UNNOBA/SIB2019/EXP 536/2019/AR. Buenos Aires/Tecnología y Aplicaciones de Sistemas de Software: Calidad e Innovación en procesos, productos y servicios https://ieeexplore.ieee.org/document/9074000 info:eu-repo/semantics/closedAccess https://creativecommons.org/licenses/by-nc-nd/2.5/ar/ application/pdf application/pdf text/plain IEEE XLV CONFERENCIA LATINOAMERICANA DE INFORMÁTICA
institution Universidad Nacional del Noroeste de la Provincia de Buenos Aires
institution_str I-103
repository_str R-405
collection Re DI Repositorio Digital UNNOBA
language Español
topic Normalización léxica
Minería de textos
Análisis de sentimientos
Aprendizaje automático
spellingShingle Normalización léxica
Minería de textos
Análisis de sentimientos
Aprendizaje automático
Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
topic_facet Normalización léxica
Minería de textos
Análisis de sentimientos
Aprendizaje automático
description El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandarización de los textos. Esto último tiene por finalidad, mejorar la exactitud final de la tarea de clasificación antes mencionada. En este trabajo se definen y ejecutan una serie de tareas de limpieza sobre un dataset de comentarios extraídos de la red social Facebook. El objetivo es verificar si las correcciones realizadas por dichas tareas, se traducen en una mejora significativa en la exactitud alcanzada por el algoritmo de clasificación. Los resultados obtenidos indican que, sobre este tipo de dataset, tareas de preprocesamiento con un desempeño razonablemente bueno en lo que se refiere a corrección de errores, no necesariamente conducen a una mejora notoria en la exactitud de la clasificación de los textos.
author2 0000-0001-6298-9019
author_facet 0000-0001-6298-9019
Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
format Documento de conferencia
Documento de conferencia
acceptedVersion
Documento de conferencia
Documento de conferencia
acceptedVersion
Documento de conferencia
Documento de conferencia
acceptedVersion
author Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
author_sort Esnaola, Leonardo
title Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
title_short Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
title_full Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
title_fullStr Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
title_full_unstemmed Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
title_sort efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
publisher IEEE
publishDate 2021
url https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140
work_keys_str_mv AT esnaolaleonardo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico
AT tessorejuanpablo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico
AT ramonhugo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico
AT russoclaudia efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico
_version_ 1850060716423249920