Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado

En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas considera...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Badgen, Iván Matías
Otros Autores: Castaño, José Daniel
Formato: Tesis de grado publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2015
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000433_Badgen_oai
Aporte de:
id I28-R145-seminario_nCOM000433_Badgen_oai
record_format dspace
spelling I28-R145-seminario_nCOM000433_Badgen_oai2023-08-29 Castaño, José Daniel Badgen, Iván Matías 2015-06-08 En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano. Fil: Badgen, Iván Matías. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar WEB MINING INFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINES Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000433_Badgen_oai
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
spellingShingle WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
Badgen, Iván Matías
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
topic_facet WEB MINING
INFORMATION RETRIEVAL
CLASSIFICATION
CLUSTERING
SEARCH ENGINES
description En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano.
author2 Castaño, José Daniel
author_facet Castaño, José Daniel
Badgen, Iván Matías
format Tesis de grado
Tesis de grado
publishedVersion
author Badgen, Iván Matías
author_sort Badgen, Iván Matías
title Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_short Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_full Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_fullStr Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_full_unstemmed Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
title_sort un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2015
url https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000433_Badgen_oai
work_keys_str_mv AT badgenivanmatias unprototipodebuscadorverticalsobrecinedocumentalasistidoporaprendizajesupervisado
_version_ 1782033783494541312