Compresión de índices para bases de datos textuales

Mientras que en bases de datos tradicionales los índices ocupan menos espacio que el conjunto de datos indexados, en bases de datos de texto el índice generalmente ocupa más espacio que el texto pudiendo necesitar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado p...

Descripción completa

Guardado en:

Detalles Bibliográficos
Autores principales:	Navarro, Gonzalo, Rodríguez Brisaboa, Nieves, Herrera, Norma Edith, Ruano, Carina, Ruano, Darío, Villegas, Ana
Formato:	Objeto de conferencia
Lenguaje:	Español
Publicado:	2010
Materias:	Ciencias Informáticas Data mining Bases de datos de texto base de datos Índices Compresión Memoria Secundaria
Acceso en línea:	http://sedici.unlp.edu.ar/handle/10915/19474
Aporte de:	SEDICI (UNLP) de Universidad Nacional de La Plata

Descripción
Sumario:	Mientras que en bases de datos tradicionales los índices ocupan menos espacio que el conjunto de datos indexados, en bases de datos de texto el índice generalmente ocupa más espacio que el texto pudiendo necesitar de 4 a 20 veces el tamaño del mismo. Una alternativa para reducir el espacio ocupado por el índice es buscar una representación compacta del mismo, manteniendo las facilidades de navegación sobre la estructura. Pero en grandes colecciones de texto, el índice aún comprimido suele ser demasiado grande como para residir en memoria principal. En estos casos, la cantidad de accesos a memoria secundaria realizados durante el proceso de búsqueda es un factor crítico en la performance del índice. En este trabajo estamos interesados en el diseño de índices comprimidos y en memoria secundaria para búsquedas en texto, un tema de creciente interés en la comunidad de bases de datos.

Compresión de índices para bases de datos textuales

Ejemplares similares