Predicción de enlaces en redes sociales con enfoque de aprendizaje
El objetivo del presente trabajo es el estudio de las técnicas de aprendizaje, en este caso supervisado, para la predicción de enlaces inexistentes u ocultos, entre usuarios de una misma red social. Las redes pueden representarse mediante grafos, en los cuáles los nodos corresponden a usuarios, y l...
Guardado en:
Autores principales: | , |
---|---|
Formato: | Artículo revista |
Lenguaje: | Español |
Publicado: |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
2017
|
Materias: | |
Acceso en línea: | http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1460 |
Aporte de: |
id |
I21-R190-123456789-1460 |
---|---|
record_format |
ojs |
institution |
Universidad Nacional del Centro |
institution_str |
I-21 |
repository_str |
R-190 |
container_title_str |
Repositorio Institucional de Acceso Abierto (RIDAA) |
language |
Español |
format |
Artículo revista |
topic |
Ingeniería de sistemas Redes sociales Técnicas de aprendizaje Herramienta Gephi |
spellingShingle |
Ingeniería de sistemas Redes sociales Técnicas de aprendizaje Herramienta Gephi Coussirat, Luis María Bongiorno, Emilio Predicción de enlaces en redes sociales con enfoque de aprendizaje |
topic_facet |
Ingeniería de sistemas Redes sociales Técnicas de aprendizaje Herramienta Gephi |
author |
Coussirat, Luis María Bongiorno, Emilio |
author_facet |
Coussirat, Luis María Bongiorno, Emilio |
author_sort |
Coussirat, Luis María |
title |
Predicción de enlaces en redes sociales con enfoque de aprendizaje |
title_short |
Predicción de enlaces en redes sociales con enfoque de aprendizaje |
title_full |
Predicción de enlaces en redes sociales con enfoque de aprendizaje |
title_fullStr |
Predicción de enlaces en redes sociales con enfoque de aprendizaje |
title_full_unstemmed |
Predicción de enlaces en redes sociales con enfoque de aprendizaje |
title_sort |
predicción de enlaces en redes sociales con enfoque de aprendizaje |
description |
El objetivo del presente trabajo es el estudio de las técnicas de aprendizaje, en este caso supervisado, para la predicción de enlaces inexistentes u ocultos, entre usuarios de una misma red social.
Las redes pueden representarse mediante grafos, en los cuáles los nodos corresponden a usuarios, y las aristas a las relaciones entre ellos. Desde el punto de vista del aprendizaje supervisado, es necesario crear datasets que contengan toda la información de los grafos. Las instancias de los mismos corresponden a cada par de nodos, y los atributos a los valores de similitud entre ellos a partir de distintas funciones. La clase de las instancias está dada por la existencia o no de enlace entre los nodos, por lo tanto, la predicción de enlaces pasa a ser un problema de clasificación binaria.
Se utilizó la herramienta Gephi como base sobre la cual implementar los requerimientos necesarios para realizar la experimentación. La misma cuenta con utilidades para manipulación de grafos y el cálculo de distintas funciones de similitud entre pares de nodos. Adicionalmente, fue necesario agregar funcionalidades para la creación y clasificación de datasets a partir de grafos, y se agregaron un conjunto de técnicas para mejorar y flexibilizar el proceso de clasificación: filtrado de instancias, selección de atributos y balanceo de datasets.
Para la experimentación se utilizaron cuatro redes con características muy diferentes, ya sea en cuanto a tamaño o estructura intrínseca. Tres de las redes poseen tamaños de pequeño a mediano, y la cuarta y más importante, corresponde a un escaneo de una porción de Twitter y, por ende, de tamaño considerable. A su vez es la red más desconectada de las cuatro.
Debido a la gran cantidad de combinaciones posibles dadas por las redes, técnicas y clasificadores a probar, la experimentación se realizó por etapas. Dado que las funciones de similitud individuales son útiles por sí mismas para la predicción de enlaces, aunque con un funcionamiento muy diferente, el objetivo de la última etapa fue la comparación del enfoque de aprendizaje supervisado contra las funciones, cotejando la calidad de ambos tipos de modelos predictores.
Se obtuvieron variadas conclusiones. El filtrado de instancias por vecinos comunes mejora en todos los casos a la clasificación. La selección de atributos fue beneficiosa en el caso de las redes pequeñas y medianas. El balance beneficia especialmente al dataset de Twitter donde el desbalance extremo impedía clasificaciones significativamente útiles. Finalmente, el enfoque de aprendizaje posee mayor calidad y flexibilidad que las funciones individuales, sin embargo, se necesita mayor cantidad de pruebas y de configuración. En redes grandes, el enfoque de funciones se vuelve inútil debido a su baja flexibilidad y rendimiento. |
publisher |
Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas |
publishDate |
2017 |
url |
http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1460 |
work_keys_str_mv |
AT coussiratluismaria predicciondeenlacesenredessocialesconenfoquedeaprendizaje AT bongiornoemilio predicciondeenlacesenredessocialesconenfoquedeaprendizaje |
first_indexed |
2022-07-04T14:36:53Z |
last_indexed |
2022-07-04T14:36:53Z |
bdutipo_str |
Revistas |
_version_ |
1764819786627284993 |