Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing

Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Kraiselburd, Cecilia, Gentile, Matias, Varani, Bruno, Neirotti, Fabricio, Amar, Eduardo, Moine, Juan, Bigatti, Cristian
Otros Autores: Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta)
Formato: Documento de conferencia
Lenguaje:Español
Publicado: Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2016
Materias:
Acceso en línea:https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981
Aporte de:
id I49-R155-61981
record_format dspace
spelling I49-R155-619812024-12-03T19:39:00Z https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981 61981 20170807u u u0frey0103 ba spa Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2016-12-30 info:eu-repo/semantics/submittedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia application/pdf 1001514 Salta (province) Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y ventaja de generar una matriz de distancia entre tweets para la posterior aplicación de algoritmos de clustering sobre la misma con una combinación óptima de parámetros. Previamente a su aplicación se utilizó la técnica de Minhash mediante el desglose de tweets en n-gramas para optimizar el cálculo. Los resultados obtenidos son prometedores, mostrando la utilidad del método aplicado para descubrir grupos temáticos de tweets a partir de un conjunto grande de datos obtenidos de Twitter. Fil: Bigatti, Cristian. Universidad Tecnológica Nacional. Facultad Regional Rosario; Argentina. Fil: Moine, Juan. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Amar, Eduardo. Universidad Tecnológica Nacional. Facultad Regional Rosario; Argentina. Fil: Neirotti, Fabricio. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Varani, Bruno. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Gentile, Matias. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Kraiselburd, Cecilia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Kraiselburd, Cecilia Gentile, Matias Varani, Bruno Neirotti, Fabricio Amar, Eduardo Moine, Juan Bigatti, Cristian Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta) Redes sociales Informática Base de datos Procesamiento de datos Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) https://creativecommons.org/licenses/by-nc-sa/4.0/ info:eu-repo/semantics/openAccess Researchers Students
institution Universidad Católica de Salta
institution_str I-49
repository_str R-155
collection Repositorio Digital - Universidad Católica de Salta (UCASal)
language Español
orig_language_str_mv spa
topic Redes sociales
Informática
Base de datos
Procesamiento de datos
spellingShingle Redes sociales
Informática
Base de datos
Procesamiento de datos
Kraiselburd, Cecilia
Gentile, Matias
Varani, Bruno
Neirotti, Fabricio
Amar, Eduardo
Moine, Juan
Bigatti, Cristian
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
topic_facet Redes sociales
Informática
Base de datos
Procesamiento de datos
description Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y ventaja de generar una matriz de distancia entre tweets para la posterior aplicación de algoritmos de clustering sobre la misma con una combinación óptima de parámetros. Previamente a su aplicación se utilizó la técnica de Minhash mediante el desglose de tweets en n-gramas para optimizar el cálculo. Los resultados obtenidos son prometedores, mostrando la utilidad del método aplicado para descubrir grupos temáticos de tweets a partir de un conjunto grande de datos obtenidos de Twitter.
author2 Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta)
author_facet Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta)
Kraiselburd, Cecilia
Gentile, Matias
Varani, Bruno
Neirotti, Fabricio
Amar, Eduardo
Moine, Juan
Bigatti, Cristian
format submittedVersion
Documento de conferencia
Documento de conferencia
author Kraiselburd, Cecilia
Gentile, Matias
Varani, Bruno
Neirotti, Fabricio
Amar, Eduardo
Moine, Juan
Bigatti, Cristian
author_sort Kraiselburd, Cecilia
title Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
title_short Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
title_full Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
title_fullStr Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
title_full_unstemmed Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
title_sort un nuevo método para clustering de tweets basado en métodos de ensambles y técnicas de hashing
publisher Universidad Católica de Salta. Facultad de Ingeniería (Salta)
publishDate 2016
url https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981
work_keys_str_mv AT kraiselburdcecilia unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT gentilematias unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT varanibruno unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT neirottifabricio unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT amareduardo unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT moinejuan unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
AT bigatticristian unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing
_version_ 1823985347248259072