Métodos de paginación paraíndices métricos basados en pivotes

El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memo...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Villegas, Ana, Chávez, Edgar, Herrera, Norma Edith
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2004
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/22287
Aporte de:
id I19-R120-10915-22287
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
spellingShingle Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
Villegas, Ana
Chávez, Edgar
Herrera, Norma Edith
Métodos de paginación paraíndices métricos basados en pivotes
topic_facet Ciencias Informáticas
Búsquedas por Similitud
base de datos
SOFTWARE ENGINEERING
Índices
Metrics
Memoria Secundaria
description El problema de buscar objetos en una base de datos que sean similares a uno dado puede formalizarse por medio del modelo de Espacios Métricos. La mayoría de las soluciones existentes para búsquedas por similitud en espacios métricos suponen que tanto el espacio como el índice completo entran en memoria principal. En este artículo presentamos una implementación del Fixed Queries Trie (FQtrie) que permite manejar espacios métricos cuyo índice completo y/o datos exceda la capacidad de la memoria principal. Para ello, en lugar de modificar la estructura para que sea eficiente en memoria secundaria, particionamos el espacio de manera tal que cada una de las partes entre en memoria principal, las que posteriormente se indexan en forma separada. Luego, una búsqueda se resuelve buscando en cada parte, lo que puede ser hecho en memoria principal y en paralelo. Para particionar el espacio hemos diseñado un método basado en la distancia LCS (longest common subsequence). Mostramos experimentalmente que esta forma de particionar, ante una búsqueda, implica menor cantidad de accesos a disco que si el espacio se particiona en forma totalmente aleatoria.
format Objeto de conferencia
Objeto de conferencia
author Villegas, Ana
Chávez, Edgar
Herrera, Norma Edith
author_facet Villegas, Ana
Chávez, Edgar
Herrera, Norma Edith
author_sort Villegas, Ana
title Métodos de paginación paraíndices métricos basados en pivotes
title_short Métodos de paginación paraíndices métricos basados en pivotes
title_full Métodos de paginación paraíndices métricos basados en pivotes
title_fullStr Métodos de paginación paraíndices métricos basados en pivotes
title_full_unstemmed Métodos de paginación paraíndices métricos basados en pivotes
title_sort métodos de paginación paraíndices métricos basados en pivotes
publishDate 2004
url http://sedici.unlp.edu.ar/handle/10915/22287
work_keys_str_mv AT villegasana metodosdepaginacionparaindicesmetricosbasadosenpivotes
AT chavezedgar metodosdepaginacionparaindicesmetricosbasadosenpivotes
AT herreranormaedith metodosdepaginacionparaindicesmetricosbasadosenpivotes
bdutipo_str Repositorios
_version_ 1764820465525719041