Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos

En la era digital, las redes sociales han cambiado la forma de comunicarnos: las mismas se convirtieron en una fuente de información e intercambio fundamental. El contenido que se genera en ellas requiere ser analizado mediante la aplicación de diversas técnicas de procesamiento del lenguaje natu...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Nazar Anchorena, Consuelo
Otros Autores: Rabbione, Luca
Formato: Artículo Tesis de maestría acceptedVersion
Lenguaje:Español
Publicado: Universidad Torcuato Di Tella 2023
Materias:
Acceso en línea:https://repositorio.utdt.edu/handle/20.500.13098/11861
Aporte de:
id I57-R163-20.500.13098-11861
record_format dspace
spelling I57-R163-20.500.13098-118612023-06-06T07:36:35Z Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos Nazar Anchorena, Consuelo Rabbione, Luca Redes Sociales (en línea) Tecnología de la Información Comportamiento del Consumidor Aprendizaje automático Análisis de sentimientos En la era digital, las redes sociales han cambiado la forma de comunicarnos: las mismas se convirtieron en una fuente de información e intercambio fundamental. El contenido que se genera en ellas requiere ser analizado mediante la aplicación de diversas técnicas de procesamiento del lenguaje natural, con el propósito de encontrar tendencias o patrones en las opiniones y comportamientos de las personas. Dicho análisis, le permite a las distintas áreas de las organizaciones enfocar sus esfuerzos en desarrollar estrategias que busquen la satisfacción de los consumidores, así como también que les permita posicionar sus propuestas y productos. Este estudio se centra en la identificación de las dimensiones claves relacionadas con la compra de teléfonos móviles a través de internet. Específicamente nos basamos en información recolectada de Mercado Libre, ya que es un comercio electrónico que contiene un gran volumen de datos. En primer lugar, extrajimos los datos de las reseñas de la categoría "Celulares y Teléfonos" y realizamos un preprocesamiento de los mismos, que incluyó la eliminación de palabras vacías, la normalización y tokenización de los datos. Luego, para comenzar a comprender las razones en las cuáles los consumidores se basan para realizar sus elecciones, aplicamos métodos de aprendizaje no supervisado, que incluyeron la extracción de los cinco tópicos principales, utilizando la transformación del texto a una bolsa de palabras (en inglés, bag of words) y el método de Asignación latente de Dirichlet (LDA). También lo complementamos con técnicas de análisis de sentimiento, que están enfocadas en comprender las diversas palabras y expresiones que los seres humanos utilizamos para expresar nuestro grado de aceptación hacia un tema o producto, de manera de poder convertir las emociones en información objetiva. Adicionamos a lo mencionado anteriormente, métodos de aprendizaje supervisado para aprovechar la información contenida en las etiquetas, es decir, en los puntajes de las reseñas. Para ello utilizamos una combinación de dos tipos de enfoques para extraer características: el enfoque de la bolsa de palabras previamente mencionado y TF-IDF (del inglés Term frequency – Inverse document frequency, frecuencia de término – frecuencia inversa de documento). Luego, entrenamos y evaluamos algoritmos de clasificación capaces de predecir los puntajes, de manera tal que puedan darnos una valoración social lo más acertada posible. Nos enfocamos en cuatro modelos de clasificación: Random Forest (en español, Bosque Aleatorio), Support Vector Machine (en español, Máquinas de Vector Soporte), Naive Bayes (en español, Bayes Ingenuo) y Logistic Regression (en español, Regresión Logística). Los resultados del estudio encuentran implicaciones prácticas para el desarrollo de los celulares, ya que permiten hacer foco en los tópicos y aspectos clave en los que los consumidores se basan para hacer sus elecciones. 2023-06-05T21:47:56Z 2023-06-05T21:47:56Z 2022 info:eu-repo/semantics/article info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/acceptedVersion https://repositorio.utdt.edu/handle/20.500.13098/11861 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-sa/2.5/ar/ 46 p. application/pdf application/pdf Universidad Torcuato Di Tella
institution Universidad Torcuato Di Tella
institution_str I-57
repository_str R-163
collection Repositorio Digital Universidad Torcuato Di Tella
language Español
orig_language_str_mv spa
topic Redes Sociales (en línea)
Tecnología de la Información
Comportamiento del Consumidor
Aprendizaje automático
Análisis de sentimientos
spellingShingle Redes Sociales (en línea)
Tecnología de la Información
Comportamiento del Consumidor
Aprendizaje automático
Análisis de sentimientos
Nazar Anchorena, Consuelo
Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
topic_facet Redes Sociales (en línea)
Tecnología de la Información
Comportamiento del Consumidor
Aprendizaje automático
Análisis de sentimientos
description En la era digital, las redes sociales han cambiado la forma de comunicarnos: las mismas se convirtieron en una fuente de información e intercambio fundamental. El contenido que se genera en ellas requiere ser analizado mediante la aplicación de diversas técnicas de procesamiento del lenguaje natural, con el propósito de encontrar tendencias o patrones en las opiniones y comportamientos de las personas. Dicho análisis, le permite a las distintas áreas de las organizaciones enfocar sus esfuerzos en desarrollar estrategias que busquen la satisfacción de los consumidores, así como también que les permita posicionar sus propuestas y productos. Este estudio se centra en la identificación de las dimensiones claves relacionadas con la compra de teléfonos móviles a través de internet. Específicamente nos basamos en información recolectada de Mercado Libre, ya que es un comercio electrónico que contiene un gran volumen de datos. En primer lugar, extrajimos los datos de las reseñas de la categoría "Celulares y Teléfonos" y realizamos un preprocesamiento de los mismos, que incluyó la eliminación de palabras vacías, la normalización y tokenización de los datos. Luego, para comenzar a comprender las razones en las cuáles los consumidores se basan para realizar sus elecciones, aplicamos métodos de aprendizaje no supervisado, que incluyeron la extracción de los cinco tópicos principales, utilizando la transformación del texto a una bolsa de palabras (en inglés, bag of words) y el método de Asignación latente de Dirichlet (LDA). También lo complementamos con técnicas de análisis de sentimiento, que están enfocadas en comprender las diversas palabras y expresiones que los seres humanos utilizamos para expresar nuestro grado de aceptación hacia un tema o producto, de manera de poder convertir las emociones en información objetiva. Adicionamos a lo mencionado anteriormente, métodos de aprendizaje supervisado para aprovechar la información contenida en las etiquetas, es decir, en los puntajes de las reseñas. Para ello utilizamos una combinación de dos tipos de enfoques para extraer características: el enfoque de la bolsa de palabras previamente mencionado y TF-IDF (del inglés Term frequency – Inverse document frequency, frecuencia de término – frecuencia inversa de documento). Luego, entrenamos y evaluamos algoritmos de clasificación capaces de predecir los puntajes, de manera tal que puedan darnos una valoración social lo más acertada posible. Nos enfocamos en cuatro modelos de clasificación: Random Forest (en español, Bosque Aleatorio), Support Vector Machine (en español, Máquinas de Vector Soporte), Naive Bayes (en español, Bayes Ingenuo) y Logistic Regression (en español, Regresión Logística). Los resultados del estudio encuentran implicaciones prácticas para el desarrollo de los celulares, ya que permiten hacer foco en los tópicos y aspectos clave en los que los consumidores se basan para hacer sus elecciones.
author2 Rabbione, Luca
author_facet Rabbione, Luca
Nazar Anchorena, Consuelo
format Artículo
Tesis de maestría
acceptedVersion
author Nazar Anchorena, Consuelo
author_sort Nazar Anchorena, Consuelo
title Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
title_short Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
title_full Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
title_fullStr Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
title_full_unstemmed Extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
title_sort extracción de patrones en las reseñas sobre celulares mediante el modelado de temas y el análisis de sentimientos
publisher Universidad Torcuato Di Tella
publishDate 2023
url https://repositorio.utdt.edu/handle/20.500.13098/11861
work_keys_str_mv AT nazaranchorenaconsuelo extracciondepatronesenlasresenassobrecelularesmedianteelmodeladodetemasyelanalisisdesentimientos
_version_ 1768086693692309504