Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing
Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y...
Guardado en:
| Autores principales: | , , , , , , |
|---|---|
| Otros Autores: | |
| Formato: | submittedVersion Documento de conferencia |
| Lenguaje: | Español |
| Publicado: |
Universidad Católica de Salta. Facultad de Ingeniería (Salta)
2016
|
| Materias: | |
| Acceso en línea: | https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981 |
| Aporte de: |
| id |
I49-R155-61981 |
|---|---|
| record_format |
dspace |
| spelling |
I49-R155-619812024-12-03T19:39:00Z https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981 61981 20170807u u u0frey0103 ba spa Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2016-12-30 info:eu-repo/semantics/submittedVersion info:eu-repo/semantics/conferenceObject info:ar-repo/semantics/documento de conferencia application/pdf 1001514 Salta (province) Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y ventaja de generar una matriz de distancia entre tweets para la posterior aplicación de algoritmos de clustering sobre la misma con una combinación óptima de parámetros. Previamente a su aplicación se utilizó la técnica de Minhash mediante el desglose de tweets en n-gramas para optimizar el cálculo. Los resultados obtenidos son prometedores, mostrando la utilidad del método aplicado para descubrir grupos temáticos de tweets a partir de un conjunto grande de datos obtenidos de Twitter. Fil: Bigatti, Cristian. Universidad Tecnológica Nacional. Facultad Regional Rosario; Argentina. Fil: Moine, Juan. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Amar, Eduardo. Universidad Tecnológica Nacional. Facultad Regional Rosario; Argentina. Fil: Neirotti, Fabricio. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Varani, Bruno. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Gentile, Matias. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Kraiselburd, Cecilia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Kraiselburd, Cecilia Gentile, Matias Varani, Bruno Neirotti, Fabricio Amar, Eduardo Moine, Juan Bigatti, Cristian Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta) Redes sociales Informática Base de datos Procesamiento de datos Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) https://creativecommons.org/licenses/by-nc-sa/4.0/ info:eu-repo/semantics/openAccess Researchers Students |
| institution |
Universidad Católica de Salta |
| institution_str |
I-49 |
| repository_str |
R-155 |
| collection |
Repositorio Digital - Universidad Católica de Salta (UCASal) |
| language |
Español |
| orig_language_str_mv |
spa |
| topic |
Redes sociales Informática Base de datos Procesamiento de datos |
| spellingShingle |
Redes sociales Informática Base de datos Procesamiento de datos Kraiselburd, Cecilia Gentile, Matias Varani, Bruno Neirotti, Fabricio Amar, Eduardo Moine, Juan Bigatti, Cristian Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| topic_facet |
Redes sociales Informática Base de datos Procesamiento de datos |
| description |
Este trabajo tiene como objetivo abordar un nuevo método de clustering basado en métodos de ensambles aplicados a datos no estructurados provenientes de la red social Twitter. Se aplicó particularmente el método de clustering por acumulación de evidencia (EAC). Dicha técnica brinda la posibilidad y ventaja de generar una matriz de distancia entre tweets para la posterior aplicación de algoritmos de clustering sobre la misma con una combinación óptima de parámetros. Previamente a su aplicación se utilizó la técnica de Minhash mediante el desglose de tweets en n-gramas para optimizar el cálculo. Los resultados obtenidos son prometedores, mostrando la utilidad del método aplicado para descubrir grupos temáticos de tweets a partir de un conjunto grande de datos obtenidos de Twitter. |
| author2 |
Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta) |
| author_facet |
Congreso Nacional de Ingeniería en Informática / Sistemas de información (4° : 2016 nov. 17-18 : Salta) Kraiselburd, Cecilia Gentile, Matias Varani, Bruno Neirotti, Fabricio Amar, Eduardo Moine, Juan Bigatti, Cristian |
| format |
submittedVersion Documento de conferencia Documento de conferencia |
| author |
Kraiselburd, Cecilia Gentile, Matias Varani, Bruno Neirotti, Fabricio Amar, Eduardo Moine, Juan Bigatti, Cristian |
| author_sort |
Kraiselburd, Cecilia |
| title |
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| title_short |
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| title_full |
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| title_fullStr |
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| title_full_unstemmed |
Un nuevo método para clustering de tweets Basado en métodos de ensambles y técnicas de hashing |
| title_sort |
un nuevo método para clustering de tweets basado en métodos de ensambles y técnicas de hashing |
| publisher |
Universidad Católica de Salta. Facultad de Ingeniería (Salta) |
| publishDate |
2016 |
| url |
https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=61981 |
| work_keys_str_mv |
AT kraiselburdcecilia unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT gentilematias unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT varanibruno unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT neirottifabricio unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT amareduardo unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT moinejuan unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing AT bigatticristian unnuevometodoparaclusteringdetweetsbasadoenmetodosdeensamblesytecnicasdehashing |
| _version_ |
1823985347248259072 |