Implementación de un digesto digital paralelo para búsquedas por similitud sobre documentos

La búsqueda por similitud consiste en recuperar todos aquellos objetos dentro de una base de datos que sean parecidos o relevantes a una determinada consulta. Este concepto tiene una amplia gama de aplicaciones en áreas como bases de datos multimedia, reconocimiento de patrones, minería de datos, re...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Solar, Roberto, Uribe Paredes, Roberto, Gesto, Esteban, Osiris, Sofía
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2008
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/21972
Aporte de:
Descripción
Sumario:La búsqueda por similitud consiste en recuperar todos aquellos objetos dentro de una base de datos que sean parecidos o relevantes a una determinada consulta. Este concepto tiene una amplia gama de aplicaciones en áreas como bases de datos multimedia, reconocimiento de patrones, minería de datos, recuperación de información, etc. La necesidad de procesar grandes volúmenes de datos y de poner a disposición de los usuarios respuestas rápidas a sus consultas hace que las estructuras que soportan este tipo de búsquedas deban ser paralelizadas. Por otro lado, la cantidad de información generada por instituciones públicas y privadas y la necesidad de recuperar documentos de formas más complejas, permite la unión de las áreas de paralelismo y búsqueda por similitud en una aplicación real. El presente artículo presenta un solución eficiente y de bajo costo de un motor de búsqueda paralelo, presentando una alternativa para consultas en un Digesto Digital Institucional, la búsqueda de documentos por similitud.