Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático
El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandari...
Guardado en:
| Autores principales: | , , , |
|---|---|
| Otros Autores: | |
| Formato: | Documento de conferencia acceptedVersion |
| Lenguaje: | Español |
| Publicado: |
IEEE
2021
|
| Materias: | |
| Acceso en línea: | https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140 |
| Aporte de: |
| id |
I103-R405-23601-140 |
|---|---|
| record_format |
dspace |
| spelling |
I103-R405-23601-1402025-10-17T21:27:38Z Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia 0000-0001-6298-9019 0000-0002-2111-0976 0000-0003-1577-3092 Normalización léxica Minería de textos Análisis de sentimientos Aprendizaje automático El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandarización de los textos. Esto último tiene por finalidad, mejorar la exactitud final de la tarea de clasificación antes mencionada. En este trabajo se definen y ejecutan una serie de tareas de limpieza sobre un dataset de comentarios extraídos de la red social Facebook. El objetivo es verificar si las correcciones realizadas por dichas tareas, se traducen en una mejora significativa en la exactitud alcanzada por el algoritmo de clasificación. Los resultados obtenidos indican que, sobre este tipo de dataset, tareas de preprocesamiento con un desempeño razonablemente bueno en lo que se refiere a corrección de errores, no necesariamente conducen a una mejora notoria en la exactitud de la clasificación de los textos. Fil: Esnaola, Leonardo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Tessore, Juan Pablo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Tessore, Juan Pablo. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Fil: Ramón, Hugo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Ramón, Hugo. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Fil: Russo, Claudia. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología, Centro Asociado CIC; Argentina Fil: Russo, Claudia. Comisión de Investigaciones Científicas de la Provincia de Buenos Aires Con referato 2021-07-26T13:17:10Z 2021-07-26T13:17:10Z 2019-09-30 info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/acceptedVersion L. Esnaola, J. P. Tessore, H. Ramón and C. Russo, "Effectiveness of preprocessing techniques over social media texts for the improvement of machine learning based classifiers," 2019 XLV Latin American Computing Conference (CLEI), 2019, pp. 1-10, doi: 10.1109/CLEI47609.2019.235076. 978-1-7281-5574-6 978-1-7281-5575-3 (Impresión bajo demanda (PoD)) https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140 spa info:eu-repo/grantAgreement/UNNOBA/SIB2019/EXP 536/2019/AR. Buenos Aires/Tecnología y Aplicaciones de Sistemas de Software: Calidad e Innovación en procesos, productos y servicios https://ieeexplore.ieee.org/document/9074000 info:eu-repo/semantics/closedAccess https://creativecommons.org/licenses/by-nc-nd/2.5/ar/ application/pdf application/pdf text/plain IEEE XLV CONFERENCIA LATINOAMERICANA DE INFORMÁTICA |
| institution |
Universidad Nacional del Noroeste de la Provincia de Buenos Aires |
| institution_str |
I-103 |
| repository_str |
R-405 |
| collection |
Re DI Repositorio Digital UNNOBA |
| language |
Español |
| topic |
Normalización léxica Minería de textos Análisis de sentimientos Aprendizaje automático |
| spellingShingle |
Normalización léxica Minería de textos Análisis de sentimientos Aprendizaje automático Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| topic_facet |
Normalización léxica Minería de textos Análisis de sentimientos Aprendizaje automático |
| description |
El lenguaje utilizado en el ámbito de las redes sociales, suele tener un mayor grado de informalidad que el proveniente de fuentes tradicionales. Los trabajos que toman
dicho contenido para tareas de clasificación basadas en aprendizaje automático realizan, en primer lugar, una limpieza y estandarización de los textos. Esto último tiene por finalidad,
mejorar la exactitud final de la tarea de clasificación antes mencionada. En este trabajo se definen y ejecutan una serie de tareas de limpieza sobre un dataset de comentarios extraídos de la red social Facebook. El objetivo es verificar si las correcciones
realizadas por dichas tareas, se traducen en una mejora significativa en la exactitud alcanzada por el algoritmo de clasificación. Los resultados obtenidos indican que, sobre este tipo de dataset, tareas de preprocesamiento con un desempeño razonablemente bueno en lo que se refiere a corrección de errores, no necesariamente conducen a una mejora notoria en la exactitud de la clasificación de los textos. |
| author2 |
0000-0001-6298-9019 |
| author_facet |
0000-0001-6298-9019 Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia |
| format |
Documento de conferencia Documento de conferencia acceptedVersion Documento de conferencia Documento de conferencia acceptedVersion Documento de conferencia Documento de conferencia acceptedVersion |
| author |
Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia |
| author_sort |
Esnaola, Leonardo |
| title |
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| title_short |
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| title_full |
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| title_fullStr |
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| title_full_unstemmed |
Efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| title_sort |
efectividad de técnicas de preprocesamiento sobre textos de redes sociales para la mejora de clasificadores basados en aprendizaje automático |
| publisher |
IEEE |
| publishDate |
2021 |
| url |
https://repositorio.unnoba.edu.ar/xmlui/handle/23601/140 |
| work_keys_str_mv |
AT esnaolaleonardo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico AT tessorejuanpablo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico AT ramonhugo efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico AT russoclaudia efectividaddetecnicasdepreprocesamientosobretextosderedessocialesparalamejoradeclasificadoresbasadosenaprendizajeautomatico |
| _version_ |
1850060716423249920 |