Predicción de enlaces en redes sociales con enfoque de aprendizaje

El objetivo del presente trabajo es el estudio de las técnicas de aprendizaje, en este caso supervisado, para la predicción de enlaces inexistentes u ocultos, entre usuarios de una misma red social. Las redes pueden representarse mediante grafos, en los cuáles los nodos corresponden a usuarios, y l...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Coussirat, Luis María, Bongiorno, Emilio
Formato: Artículo revista
Lenguaje:Español
Publicado: Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas 2017
Materias:
Acceso en línea:http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1460
Aporte de:
id I21-R190-123456789-1460
record_format ojs
institution Universidad Nacional del Centro
institution_str I-21
repository_str R-190
container_title_str Repositorio Institucional de Acceso Abierto (RIDAA)
language Español
format Artículo revista
topic Ingeniería de sistemas
Redes sociales
Técnicas de aprendizaje
Herramienta Gephi
spellingShingle Ingeniería de sistemas
Redes sociales
Técnicas de aprendizaje
Herramienta Gephi
Coussirat, Luis María
Bongiorno, Emilio
Predicción de enlaces en redes sociales con enfoque de aprendizaje
topic_facet Ingeniería de sistemas
Redes sociales
Técnicas de aprendizaje
Herramienta Gephi
author Coussirat, Luis María
Bongiorno, Emilio
author_facet Coussirat, Luis María
Bongiorno, Emilio
author_sort Coussirat, Luis María
title Predicción de enlaces en redes sociales con enfoque de aprendizaje
title_short Predicción de enlaces en redes sociales con enfoque de aprendizaje
title_full Predicción de enlaces en redes sociales con enfoque de aprendizaje
title_fullStr Predicción de enlaces en redes sociales con enfoque de aprendizaje
title_full_unstemmed Predicción de enlaces en redes sociales con enfoque de aprendizaje
title_sort predicción de enlaces en redes sociales con enfoque de aprendizaje
description El objetivo del presente trabajo es el estudio de las técnicas de aprendizaje, en este caso supervisado, para la predicción de enlaces inexistentes u ocultos, entre usuarios de una misma red social. Las redes pueden representarse mediante grafos, en los cuáles los nodos corresponden a usuarios, y las aristas a las relaciones entre ellos. Desde el punto de vista del aprendizaje supervisado, es necesario crear datasets que contengan toda la información de los grafos. Las instancias de los mismos corresponden a cada par de nodos, y los atributos a los valores de similitud entre ellos a partir de distintas funciones. La clase de las instancias está dada por la existencia o no de enlace entre los nodos, por lo tanto, la predicción de enlaces pasa a ser un problema de clasificación binaria. Se utilizó la herramienta Gephi como base sobre la cual implementar los requerimientos necesarios para realizar la experimentación. La misma cuenta con utilidades para manipulación de grafos y el cálculo de distintas funciones de similitud entre pares de nodos. Adicionalmente, fue necesario agregar funcionalidades para la creación y clasificación de datasets a partir de grafos, y se agregaron un conjunto de técnicas para mejorar y flexibilizar el proceso de clasificación: filtrado de instancias, selección de atributos y balanceo de datasets. Para la experimentación se utilizaron cuatro redes con características muy diferentes, ya sea en cuanto a tamaño o estructura intrínseca. Tres de las redes poseen tamaños de pequeño a mediano, y la cuarta y más importante, corresponde a un escaneo de una porción de Twitter y, por ende, de tamaño considerable. A su vez es la red más desconectada de las cuatro. Debido a la gran cantidad de combinaciones posibles dadas por las redes, técnicas y clasificadores a probar, la experimentación se realizó por etapas. Dado que las funciones de similitud individuales son útiles por sí mismas para la predicción de enlaces, aunque con un funcionamiento muy diferente, el objetivo de la última etapa fue la comparación del enfoque de aprendizaje supervisado contra las funciones, cotejando la calidad de ambos tipos de modelos predictores. Se obtuvieron variadas conclusiones. El filtrado de instancias por vecinos comunes mejora en todos los casos a la clasificación. La selección de atributos fue beneficiosa en el caso de las redes pequeñas y medianas. El balance beneficia especialmente al dataset de Twitter donde el desbalance extremo impedía clasificaciones significativamente útiles. Finalmente, el enfoque de aprendizaje posee mayor calidad y flexibilidad que las funciones individuales, sin embargo, se necesita mayor cantidad de pruebas y de configuración. En redes grandes, el enfoque de funciones se vuelve inútil debido a su baja flexibilidad y rendimiento.
publisher Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
publishDate 2017
url http://www.ridaa.unicen.edu.ar/xmlui/handle/123456789/1460
work_keys_str_mv AT coussiratluismaria predicciondeenlacesenredessocialesconenfoquedeaprendizaje
AT bongiornoemilio predicciondeenlacesenredessocialesconenfoquedeaprendizaje
first_indexed 2022-07-04T14:36:53Z
last_indexed 2022-07-04T14:36:53Z
bdutipo_str Revistas
_version_ 1764819786627284993