Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información

La evaluación de sistemas de recuperación requiere contar con colecciones de prueba compuestas por un corpus de documentos, un conjunto de necesidades de información (tópicos) y los juicios de relevancia. Éstas permiten evaluar diferentes estrategias y sistemas ya que permiten comprender la naturale...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Tolosa, Gabriel Hernán, Bordignon, Fernando Raúl Alfredo, Peri, Jorge Alberto, Banchero, Santiago
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2005
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/21173
Aporte de:
id I19-R120-10915-21173
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
recuperación de información
Colecciones
información
Literature
evaluación
colección de prueba
spellingShingle Ciencias Informáticas
recuperación de información
Colecciones
información
Literature
evaluación
colección de prueba
Tolosa, Gabriel Hernán
Bordignon, Fernando Raúl Alfredo
Peri, Jorge Alberto
Banchero, Santiago
Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
topic_facet Ciencias Informáticas
recuperación de información
Colecciones
información
Literature
evaluación
colección de prueba
description La evaluación de sistemas de recuperación requiere contar con colecciones de prueba compuestas por un corpus de documentos, un conjunto de necesidades de información (tópicos) y los juicios de relevancia. Éstas permiten evaluar diferentes estrategias y sistemas ya que permiten comprender la naturaleza de los resultados, compararlos con otros y reproducir pruebas en iguales condiciones. El proceso de armado de una colección es una tarea que requiere un importante esfuerzo humano ya que no se puede realizar –de manera completa– automáticamente. En este trabajo se plantean los lineamientos para la construcción de una colección de prueba en español de dominio público a partir de artículos de investigación en el área de la informática y las ciencias de la computación. La creación de esta colección –destinada a la evaluación la recuperación “ad-hoc”– persigue como primer objetivo poner a disposición de la comunidad universitaria un corpus de documentos semi-estructurados que permita la evaluación de diferentes estrategias de búsqueda. Además, debido a que el tema de recuperación de información se encuentra en pleno crecimiento consideramos que en los próximos años se evaluará su incorporación como tema de grado en diferentes carreras. Es por ello es que creemos que este corpus sería un buen recurso didáctico para realizar tareas de laboratorio. Un segundo objetivo consiste en recolectar y procesar la mayor cantidad posible de artículos científicos publicados en español y crear una colección mayor que sirva para investigación de diversos aspectos del área de recuperación de información como: extracción de información, clasificación, respuestas a preguntas, resumen automático, entre otros. Se presenta una metodología para la selección de los documentos, la demarcación de su estructura, la creación de los tópicos y de los juicios de relevancia, junto con una primera prueba con un conjunto reducido de documentos.
format Objeto de conferencia
Objeto de conferencia
author Tolosa, Gabriel Hernán
Bordignon, Fernando Raúl Alfredo
Peri, Jorge Alberto
Banchero, Santiago
author_facet Tolosa, Gabriel Hernán
Bordignon, Fernando Raúl Alfredo
Peri, Jorge Alberto
Banchero, Santiago
author_sort Tolosa, Gabriel Hernán
title Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
title_short Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
title_full Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
title_fullStr Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
title_full_unstemmed Creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
title_sort creación de una colección de prueba de literatura científica en español para evaluar sistemas de recuperación de información
publishDate 2005
url http://sedici.unlp.edu.ar/handle/10915/21173
work_keys_str_mv AT tolosagabrielhernan creaciondeunacolecciondepruebadeliteraturacientificaenespanolparaevaluarsistemasderecuperaciondeinformacion
AT bordignonfernandoraulalfredo creaciondeunacolecciondepruebadeliteraturacientificaenespanolparaevaluarsistemasderecuperaciondeinformacion
AT perijorgealberto creaciondeunacolecciondepruebadeliteraturacientificaenespanolparaevaluarsistemasderecuperaciondeinformacion
AT bancherosantiago creaciondeunacolecciondepruebadeliteraturacientificaenespanolparaevaluarsistemasderecuperaciondeinformacion
bdutipo_str Repositorios
_version_ 1764820465527816197