Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersi...
Guardado en:
| Autores principales: | , , , |
|---|---|
| Otros Autores: | |
| Formato: | Documento de conferencia draft |
| Lenguaje: | Español |
| Publicado: |
Universidad Nacional de San Juan; Argentina
2020
|
| Materias: | |
| Acceso en línea: | http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104 |
| Aporte de: |
| id |
I103-R405-23601-104 |
|---|---|
| record_format |
dspace |
| spelling |
I103-R405-23601-1042025-11-04T16:03:44Z Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia https://orcid.org/0000-0001-6298-9019 https://orcid.org/0000-0002-2111-0976 https://orcid.org/0000-0003-1577-3092 Minería de textos Preprocesamiento Inteligencia artificial Redes sociales El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersión puede afectar el desempeño de los clasificadores de texto basados en aprendizaje automático. El presente trabajo propone medir el desempeño de diferentes tareas de preprocesamiento, aplicadas primero de manera aislada y luego combinadas, sobre contenido extraído de redes sociales. Se busca determinar cuán aptas resultan ser estas tareas para corregir errores en textos de este tipo. Para ello, en primer lugar, se determinará en qué magnitud se reduce el porcentaje de palabras “incorrectas” y, en segundo lugar, cómo impactan en la precisión final alcanzada por clasificadores basados en aprendizaje automático. Este trabajo, se enmarca en una línea de investigación más amplia que propone la construcción de un clasificador automático de opiniones utilizando algoritmos de aprendizaje automático, el cual fuera presentado previamente en otra edición de este Workshop, y que permitirá realizar análisis automáticos de bajo costo para determinar las emociones manifestadas por consumidores o usuarios acerca de productos o servicios, a partir del análisis de sus opiniones escritas. Este clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Fil: Esnaola, Leonardo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Tessore, Juan Pablo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Tessore, Juan Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina; Argentina. Fil: Ramón, Hugo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Russo, Claudia. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Con referato 2020-09-22T13:44:52Z 2020-09-22T13:44:52Z 2019-04-25 info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft 978-987-3984-85-3 http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104 spa info:eu-repo/grantAgreement/UNNOBA/SIB2019/EXP 536-2019/AR. Buenos Aires/Tecnología y Aplicaciones de Sistemas de Software: Innovación en procesos, productos y servicios info:eu-repo/semantics/closedAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ application/pdf application/pdf Universidad Nacional de San Juan; Argentina XXI Workshop de Investigadores en Ciencias de la Computación -WICC 2019 |
| institution |
Universidad Nacional del Noroeste de la Provincia de Buenos Aires |
| institution_str |
I-103 |
| repository_str |
R-405 |
| collection |
Re DI Repositorio Digital UNNOBA |
| language |
Español |
| topic |
Minería de textos Preprocesamiento Inteligencia artificial Redes sociales |
| spellingShingle |
Minería de textos Preprocesamiento Inteligencia artificial Redes sociales Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| topic_facet |
Minería de textos Preprocesamiento Inteligencia artificial Redes sociales |
| description |
El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el
contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersión puede
afectar el desempeño de los clasificadores de texto basados en aprendizaje automático. El presente trabajo propone medir el desempeño de diferentes tareas de preprocesamiento, aplicadas primero de manera aislada y luego combinadas, sobre contenido extraído de redes sociales. Se busca
determinar cuán aptas resultan ser estas tareas para corregir errores en textos de este tipo.
Para ello, en primer lugar, se determinará en qué magnitud se reduce el porcentaje de palabras “incorrectas” y, en segundo lugar, cómo impactan en la precisión final alcanzada por clasificadores basados en aprendizaje automático.
Este trabajo, se enmarca en una línea de investigación más amplia que propone la construcción de un clasificador automático de opiniones utilizando algoritmos de aprendizaje automático, el cual fuera presentado previamente en otra edición de este Workshop, y que permitirá realizar
análisis automáticos de bajo costo para determinar las emociones manifestadas por consumidores o usuarios acerca de productos o servicios, a partir del análisis de sus opiniones escritas. Este clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. |
| author2 |
https://orcid.org/0000-0001-6298-9019 |
| author_facet |
https://orcid.org/0000-0001-6298-9019 Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia |
| format |
Documento de conferencia Documento de conferencia draft Documento de conferencia Documento de conferencia draft Documento de conferencia Documento de conferencia draft |
| author |
Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia |
| author_sort |
Esnaola, Leonardo |
| title |
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| title_short |
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| title_full |
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| title_fullStr |
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| title_full_unstemmed |
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| title_sort |
análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales |
| publisher |
Universidad Nacional de San Juan; Argentina |
| publishDate |
2020 |
| url |
http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104 |
| work_keys_str_mv |
AT esnaolaleonardo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales AT tessorejuanpablo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales AT ramonhugo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales AT russoclaudia analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales |
| _version_ |
1850060758365241344 |