Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado
En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas considera...
Guardado en:
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de grado publishedVersion |
Lenguaje: | Español |
Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2015
|
Materias: | |
Acceso en línea: | https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen |
Aporte de: |
id |
seminario:seminario_nCOM000433_Badgen |
---|---|
record_format |
dspace |
spelling |
seminario:seminario_nCOM000433_Badgen2023-09-12T13:13:10Z Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado Badgen, Iván Matías Castaño, José Daniel WEB MINING INFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINES En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano. Fil: Badgen, Iván Matías. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2015-06-08 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen |
institution |
Universidad de Buenos Aires |
institution_str |
I-28 |
repository_str |
R-134 |
collection |
Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA) |
language |
Español |
orig_language_str_mv |
spa |
topic |
WEB MINING INFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINES |
spellingShingle |
WEB MINING INFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINES Badgen, Iván Matías Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
topic_facet |
WEB MINING INFORMATION RETRIEVAL CLASSIFICATION CLUSTERING SEARCH ENGINES |
description |
En este trabajo se estudian y aplican distintas técnicas de web mining e information retrieval con el objetivo de explorar el espacio de sitios web y desarrollar un prototipo de buscador sobre cine, particularmente bajo la categoría de documentales. Se comenzó partiendo de algunas semillas consideradas de interés y luego se amplió a resultados de algunos buscadores tradicionales. La idea no fue solo quedarse con ellos, sino intentar descubrir nuevos sitios que se pudieran clasificar también dentro del interés planteado. Por otra parte, utilizando crawling e indexando los resultados, se estudió el espacio obtenido en términos de grafos, para determinar qué sitios podrían ser más relevantes que otros dentro del dominio. En este caso, no necesariamente relevantes en cuanto a contenido, pero sí como potenciales semillas para encontrar otros sitios relacionados. El trabajo en buscadores verticales es usualmente complementado con técnicas de aprendizaje automático para mejorar tanto la búsqueda como la presentación de resultados. En el caso de este trabajo, se utilizaron algoritmos de clasificación para el descubrimiento de nuevas páginas relevantes y algoritmos de clustering para el análisis de los resultados obtenidos. Como resultado, se implementó un prototipo de buscador para el cine documental cuyo contenido esté restringido a documentales del cine hispano-americano. |
author2 |
Castaño, José Daniel |
author_facet |
Castaño, José Daniel Badgen, Iván Matías |
format |
Tesis de grado Tesis de grado publishedVersion |
author |
Badgen, Iván Matías |
author_sort |
Badgen, Iván Matías |
title |
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
title_short |
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
title_full |
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
title_fullStr |
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
title_full_unstemmed |
Un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
title_sort |
un prototipo de buscador vertical sobre cine documental asistido por aprendizaje supervisado |
publisher |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
publishDate |
2015 |
url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000433_Badgen |
work_keys_str_mv |
AT badgenivanmatias unprototipodebuscadorverticalsobrecinedocumentalasistidoporaprendizajesupervisado |
_version_ |
1782031582790418432 |