Indexado de Wikipedia a través de una arquitectura Map Reduce

El objetivo de este trabajo de tesis es el desarrollo de un algoritmo que permite generar un índice de caminos entre dos artículos cualesquiera de Wikipedia, lo cual se logró a través de la adaptación de un algoritmo BFS preexistente. Este algoritmo fue desarrollado adaptando Wikipedia para ser proc...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Larroque, José Luis
Otros Autores: Díaz, Alicia
Formato: Tesis Tesis de grado
Lenguaje:Español
Publicado: 2017
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/59677
Aporte de:
id I19-R120-10915-59677
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Web-based services
Java
cloud computing
spellingShingle Ciencias Informáticas
Web-based services
Java
cloud computing
Larroque, José Luis
Indexado de Wikipedia a través de una arquitectura Map Reduce
topic_facet Ciencias Informáticas
Web-based services
Java
cloud computing
description El objetivo de este trabajo de tesis es el desarrollo de un algoritmo que permite generar un índice de caminos entre dos artículos cualesquiera de Wikipedia, lo cual se logró a través de la adaptación de un algoritmo BFS preexistente. Este algoritmo fue desarrollado adaptando Wikipedia para ser procesada como un grafo en Giraph, un framework de procesamiento de grafos utilizado por grandes compañías como Facebook, Twitter, Yahoo, etc. La arquitectura de base utilizada fue Hadoop, a través de su modelo de procesamiento Map Reduce, en el cual Giraph se basa de soporte para la ejecución de algoritmos de procesamiento de grafos. La plataforma de cómputo utilizada para ejecutar este trabajo fue Amazon Web Services, a través de la funcionalidad Elastic Map Reduce. Al ser pago dicho entorno, se usó el mismo a través de una subvención para investigación.
author2 Díaz, Alicia
author_facet Díaz, Alicia
Larroque, José Luis
format Tesis
Tesis de grado
author Larroque, José Luis
author_sort Larroque, José Luis
title Indexado de Wikipedia a través de una arquitectura Map Reduce
title_short Indexado de Wikipedia a través de una arquitectura Map Reduce
title_full Indexado de Wikipedia a través de una arquitectura Map Reduce
title_fullStr Indexado de Wikipedia a través de una arquitectura Map Reduce
title_full_unstemmed Indexado de Wikipedia a través de una arquitectura Map Reduce
title_sort indexado de wikipedia a través de una arquitectura map reduce
publishDate 2017
url http://sedici.unlp.edu.ar/handle/10915/59677
work_keys_str_mv AT larroquejoseluis indexadodewikipediaatravesdeunaarquitecturamapreduce
bdutipo_str Repositorios
_version_ 1764820478859411459