P-DIndex: Optimizando las búsquedas sobre espacios métricos

Para reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida qu...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Gil Costa, Graciela Verónica, Perez, Norma, Reyes, Nora Susana
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2008
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/20650
Aporte de:
id I19-R120-10915-20650
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
spellingShingle Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
Gil Costa, Graciela Verónica
Perez, Norma
Reyes, Nora Susana
P-DIndex: Optimizando las búsquedas sobre espacios métricos
topic_facet Ciencias Informáticas
espacios métricos
Parallel
búsqueda por similitud
Distributed
description Para reducir los costos de búsqueda y acelerar los tiempos de respuestas sobre grandes colecciones de datos se utilizan índices que particionan los datos en subconjuntos de manera tal que las respuestas a las consultas pueden ser evaluadas sin examinar exhaustivamente toda la colección. A medida que crece la complejidad de los tipos de datos modernos los espacios métricos obtienen mayor popularidad como paradigma de recuperación de información. Un índice propuesto recientemente es el D-Index el cual es una estructura de múltiples niveles que permite dividir recursivamente los objetos del espacio métrico en conjuntos separables. Este índice combina técnicas de clustering y técnicas basadas en pivotes para realizar las búsquedas por similitud. Por otro lado, la resolución de consultas sobre este tipo de índices tiende a ser muy costosa por la dificultad que implica la ejecución de la función de similitud, la cual depende del tipo de objeto multimedial utilizado (video, sonido, imagen, etc.). La computación paralela es un paradigma que permite reducir los tiempos de ejecución de los algoritmos. Existen dos escuelas referentes a la comunicación en un diseño paralelo: síncrona y asíncrona. En particular en este trabajo utilizamos el modelo de computación paralela síncrono Bulk-Synchronous Parallel - BSP que provee un modelo de costo sencillo que permite predecir los tiempos de ejecución de los algoritmos paralelos.
format Objeto de conferencia
Objeto de conferencia
author Gil Costa, Graciela Verónica
Perez, Norma
Reyes, Nora Susana
author_facet Gil Costa, Graciela Verónica
Perez, Norma
Reyes, Nora Susana
author_sort Gil Costa, Graciela Verónica
title P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_short P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_full P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_fullStr P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_full_unstemmed P-DIndex: Optimizando las búsquedas sobre espacios métricos
title_sort p-dindex: optimizando las búsquedas sobre espacios métricos
publishDate 2008
url http://sedici.unlp.edu.ar/handle/10915/20650
work_keys_str_mv AT gilcostagracielaveronica pdindexoptimizandolasbusquedassobreespaciosmetricos
AT pereznorma pdindexoptimizandolasbusquedassobreespaciosmetricos
AT reyesnorasusana pdindexoptimizandolasbusquedassobreespaciosmetricos
bdutipo_str Repositorios
_version_ 1764820464696295425