Minería de textos para clasificación y análisis de sentimientos de relatos personales
El presente trabajo busca implementar herramientas y técnicas de aprendizaje automático para automatizar el proceso de análisis de los relatos recopilados en tres ediciones del libro "Matilda y las Mujeres en Ingeniería en América Latina", con el fin de identificar factores que influyen en...
Autores principales: | , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2023
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/165743 |
Aporte de: |
id |
I19-R120-10915-165743 |
---|---|
record_format |
dspace |
spelling |
I19-R120-10915-1657432024-05-08T20:04:27Z http://sedici.unlp.edu.ar/handle/10915/165743 Minería de textos para clasificación y análisis de sentimientos de relatos personales Text Mining for Classification and Sentiment Analysis of Personal Stories Ruiz Diaz, Adriana Soledad Méndez Garabetti, Miguel 2023-09 2023 2024-05-08T13:00:05Z es Ciencias Informáticas minería de textos aprendizaje automático clasificación análisis de sentimientos El presente trabajo busca implementar herramientas y técnicas de aprendizaje automático para automatizar el proceso de análisis de los relatos recopilados en tres ediciones del libro "Matilda y las Mujeres en Ingeniería en América Latina", con el fin de identificar factores que influyen en la elección y ejercicio de la carrera de ingeniería por parte de las mujeres. La metodología seguirá los lineamientos propuestos para un proceso de Descubrimiento de Conocimiento en Textos (KDT). El trabajo se dividirá en varias etapas: comprensión del dominio de aplicación, extracción de datos, limpieza, procesamiento y transformación de datos, y desarrollo del modelo. En la actualidad, el proyecto se encuentra en la fase de construcción del corpus y supresión de patrones de información no significativos. Luego se realizará una tokenización del texto para entender las características del mismo y se evaluará la técnica más adecuada para cuantificar el set de palabras presentes en el corpus. Se construirá un modelo de aprendizaje automático supervisado para predecir la temática principal del relato y se analizará el sentimiento del mismo en función de su temática. El análisis de sentimientos se realizará considerando el sentimiento como la suma de los sentimientos de cada una de las palabras que lo conforman. This work aims to implement tools and machine learning techniques to automate the process of analyzing the narratives collected in three editions of the book "Matilda and Women in Engineering in Latin America." The goal is to identify factors that influence the choice and practice of an engineering career by women. The methodology will follow the proposed guidelines for a Knowledge Discovery in Texts (KDT) process. The work will be divided into several stages: understanding the application domain, data extraction, cleaning, processing and transformation of data, and model development. Currently, the project is in the phase of constructing the corpus and removing non-significant patterns of information. Next, the text will be tokenized to understand its characteristics, and the most suitable technique for quantifying the set of words present in the corpus will be evaluated. A supervised machine learning model will be built to predict the main theme of the narrative, and its sentiment will be analyzed based on that theme. The sentiment analysis will be performed by considering sentiment as the sum of the sentiments of each of the words that compose it. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas minería de textos aprendizaje automático clasificación análisis de sentimientos |
spellingShingle |
Ciencias Informáticas minería de textos aprendizaje automático clasificación análisis de sentimientos Ruiz Diaz, Adriana Soledad Méndez Garabetti, Miguel Minería de textos para clasificación y análisis de sentimientos de relatos personales |
topic_facet |
Ciencias Informáticas minería de textos aprendizaje automático clasificación análisis de sentimientos |
description |
El presente trabajo busca implementar herramientas y técnicas de aprendizaje automático para automatizar el proceso de análisis de los relatos recopilados en tres ediciones del libro "Matilda y las Mujeres en Ingeniería en América Latina", con el fin de identificar factores que influyen en la elección y ejercicio de la carrera de ingeniería por parte de las mujeres. La metodología seguirá los lineamientos propuestos para un proceso de Descubrimiento de Conocimiento en Textos (KDT). El trabajo se dividirá en varias etapas: comprensión del dominio de aplicación, extracción de datos, limpieza, procesamiento y transformación de datos, y desarrollo del modelo. En la actualidad, el proyecto se encuentra en la fase de construcción del corpus y supresión de patrones de información no significativos. Luego se realizará una tokenización del texto para entender las características del mismo y se evaluará la técnica más adecuada para cuantificar el set de palabras presentes en el corpus. Se construirá un modelo de aprendizaje automático supervisado para predecir la temática principal del relato y se analizará el sentimiento del mismo en función de su temática. El análisis de sentimientos se realizará considerando el sentimiento como la suma de los sentimientos de cada una de las palabras que lo conforman. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Ruiz Diaz, Adriana Soledad Méndez Garabetti, Miguel |
author_facet |
Ruiz Diaz, Adriana Soledad Méndez Garabetti, Miguel |
author_sort |
Ruiz Diaz, Adriana Soledad |
title |
Minería de textos para clasificación y análisis de sentimientos de relatos personales |
title_short |
Minería de textos para clasificación y análisis de sentimientos de relatos personales |
title_full |
Minería de textos para clasificación y análisis de sentimientos de relatos personales |
title_fullStr |
Minería de textos para clasificación y análisis de sentimientos de relatos personales |
title_full_unstemmed |
Minería de textos para clasificación y análisis de sentimientos de relatos personales |
title_sort |
minería de textos para clasificación y análisis de sentimientos de relatos personales |
publishDate |
2023 |
url |
http://sedici.unlp.edu.ar/handle/10915/165743 |
work_keys_str_mv |
AT ruizdiazadrianasoledad mineriadetextosparaclasificacionyanalisisdesentimientosderelatospersonales AT mendezgarabettimiguel mineriadetextosparaclasificacionyanalisisdesentimientosderelatospersonales AT ruizdiazadrianasoledad textminingforclassificationandsentimentanalysisofpersonalstories AT mendezgarabettimiguel textminingforclassificationandsentimentanalysisofpersonalstories |
_version_ |
1807223094077554688 |