Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales

El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersi...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Esnaola, Leonardo, Tessore, Juan Pablo, Ramón, Hugo, Russo, Claudia
Otros Autores: https://orcid.org/0000-0001-6298-9019
Formato: Documento de conferencia draft
Lenguaje:Español
Publicado: Universidad Nacional de San Juan; Argentina 2020
Materias:
Acceso en línea:http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104
Aporte de:
id I103-R405-23601-104
record_format dspace
spelling I103-R405-23601-1042025-11-04T16:03:44Z Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales Esnaola, Leonardo Tessore, Juan Pablo Ramón, Hugo Russo, Claudia https://orcid.org/0000-0001-6298-9019 https://orcid.org/0000-0002-2111-0976 https://orcid.org/0000-0003-1577-3092 Minería de textos Preprocesamiento Inteligencia artificial Redes sociales El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersión puede afectar el desempeño de los clasificadores de texto basados en aprendizaje automático. El presente trabajo propone medir el desempeño de diferentes tareas de preprocesamiento, aplicadas primero de manera aislada y luego combinadas, sobre contenido extraído de redes sociales. Se busca determinar cuán aptas resultan ser estas tareas para corregir errores en textos de este tipo. Para ello, en primer lugar, se determinará en qué magnitud se reduce el porcentaje de palabras “incorrectas” y, en segundo lugar, cómo impactan en la precisión final alcanzada por clasificadores basados en aprendizaje automático. Este trabajo, se enmarca en una línea de investigación más amplia que propone la construcción de un clasificador automático de opiniones utilizando algoritmos de aprendizaje automático, el cual fuera presentado previamente en otra edición de este Workshop, y que permitirá realizar análisis automáticos de bajo costo para determinar las emociones manifestadas por consumidores o usuarios acerca de productos o servicios, a partir del análisis de sus opiniones escritas. Este clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales. Fil: Esnaola, Leonardo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Tessore, Juan Pablo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Tessore, Juan Pablo. Consejo Nacional de Investigaciones Científicas y Técnicas de Argentina; Argentina. Fil: Ramón, Hugo. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Fil: Russo, Claudia. Universidad Nacional del Noroeste de la Provincia de Buenos Aires. Escuela de Tecnología. Instituto de Investigación y Transferencia en Tecnología. Centro Asociado a la Comisión de Investigaciones Científicas de la Provincia de Buenos Aires; Argentina. Con referato 2020-09-22T13:44:52Z 2020-09-22T13:44:52Z 2019-04-25 info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia info:eu-repo/semantics/draft 978-987-3984-85-3 http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104 spa info:eu-repo/grantAgreement/UNNOBA/SIB2019/EXP 536-2019/AR. Buenos Aires/Tecnología y Aplicaciones de Sistemas de Software: Innovación en procesos, productos y servicios info:eu-repo/semantics/closedAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar/ application/pdf application/pdf Universidad Nacional de San Juan; Argentina XXI Workshop de Investigadores en Ciencias de la Computación -WICC 2019
institution Universidad Nacional del Noroeste de la Provincia de Buenos Aires
institution_str I-103
repository_str R-405
collection Re DI Repositorio Digital UNNOBA
language Español
topic Minería de textos
Preprocesamiento
Inteligencia artificial
Redes sociales
spellingShingle Minería de textos
Preprocesamiento
Inteligencia artificial
Redes sociales
Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
topic_facet Minería de textos
Preprocesamiento
Inteligencia artificial
Redes sociales
description El texto que surge de la interacción entre usuarios en redes sociales suele ser más disperso que el contenido tradicional. Es decir, contiene errores ortográficos, uso informal del lenguaje, emoticones, urls y otras construcciones que no suelen estar presentes en el lenguaje formal. Dicha dispersión puede afectar el desempeño de los clasificadores de texto basados en aprendizaje automático. El presente trabajo propone medir el desempeño de diferentes tareas de preprocesamiento, aplicadas primero de manera aislada y luego combinadas, sobre contenido extraído de redes sociales. Se busca determinar cuán aptas resultan ser estas tareas para corregir errores en textos de este tipo. Para ello, en primer lugar, se determinará en qué magnitud se reduce el porcentaje de palabras “incorrectas” y, en segundo lugar, cómo impactan en la precisión final alcanzada por clasificadores basados en aprendizaje automático. Este trabajo, se enmarca en una línea de investigación más amplia que propone la construcción de un clasificador automático de opiniones utilizando algoritmos de aprendizaje automático, el cual fuera presentado previamente en otra edición de este Workshop, y que permitirá realizar análisis automáticos de bajo costo para determinar las emociones manifestadas por consumidores o usuarios acerca de productos o servicios, a partir del análisis de sus opiniones escritas. Este clasificador será entrenado a partir de los comentarios en lenguaje informal presente en redes sociales.
author2 https://orcid.org/0000-0001-6298-9019
author_facet https://orcid.org/0000-0001-6298-9019
Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
format Documento de conferencia
Documento de conferencia
draft
Documento de conferencia
Documento de conferencia
draft
Documento de conferencia
Documento de conferencia
draft
author Esnaola, Leonardo
Tessore, Juan Pablo
Ramón, Hugo
Russo, Claudia
author_sort Esnaola, Leonardo
title Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
title_short Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
title_full Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
title_fullStr Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
title_full_unstemmed Análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
title_sort análisis comparativo de tareas de pre procesamiento de textos sobre contenido extraído de redes sociales
publisher Universidad Nacional de San Juan; Argentina
publishDate 2020
url http://repositorio.unnoba.edu.ar:8080/xmlui/handle/23601/104
work_keys_str_mv AT esnaolaleonardo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales
AT tessorejuanpablo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales
AT ramonhugo analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales
AT russoclaudia analisiscomparativodetareasdepreprocesamientodetextossobrecontenidoextraidoderedessociales
_version_ 1850060758365241344