Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría
El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presen...
Guardado en:
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de maestría acceptedVersion |
Lenguaje: | Español |
Publicado: |
2023
|
Materias: | |
Acceso en línea: | https://repositorio.utdt.edu/handle/20.500.13098/11568 |
Aporte de: |
id |
I57-R163-20.500.13098-11568 |
---|---|
record_format |
dspace |
institution |
Universidad Torcuato Di Tella |
institution_str |
I-57 |
repository_str |
R-163 |
collection |
Repositorio Digital Universidad Torcuato Di Tella |
language |
Español |
orig_language_str_mv |
spa |
topic |
Análisis de datos Predicción tecnológica Procesamiento de Lenguaje Natural Clasificación de Mensajes |
spellingShingle |
Análisis de datos Predicción tecnológica Procesamiento de Lenguaje Natural Clasificación de Mensajes Cisco, Santiago Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
topic_facet |
Análisis de datos Predicción tecnológica Procesamiento de Lenguaje Natural Clasificación de Mensajes |
description |
El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presentamos distintas técnicas de preprocesamiento de texto como tokenización, eliminación de stopwords, lematización, umbrales de frecuencia mínima para tokens y normalización TF-IDF. Hacemos pruebas sobre dos categorías para seleccionar las transformaciones que se efectúen al modelo. El modelo arroja, finalmente, una buena performance en las etiquetas de mayor frecuencia. |
author2 |
Gravano, Agustín |
author_facet |
Gravano, Agustín Cisco, Santiago |
format |
Tesis de maestría acceptedVersion |
author |
Cisco, Santiago |
author_sort |
Cisco, Santiago |
title |
Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
title_short |
Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
title_full |
Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
title_fullStr |
Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
title_full_unstemmed |
Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría |
title_sort |
clasificación de mensajes dentro de la plataforma properati: un abordaje con nlp maestría |
publishDate |
2023 |
url |
https://repositorio.utdt.edu/handle/20.500.13098/11568 |
work_keys_str_mv |
AT ciscosantiago clasificaciondemensajesdentrodelaplataformaproperatiunabordajeconnlpmaestria |
bdutipo_str |
Repositorios |
_version_ |
1764820542563549189 |