Evaluación de la calidad de la Información extraída por wrappers, de un sitio web

La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, program...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Vargas, Alejandro, Sánchez Rivero, David, Valdéz, Ángel, Bernechea, Miguel, Castillo, Natalia, Colqui, Reinaldo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2013
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/27136
Aporte de:
id I19-R120-10915-27136
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
informática y tratamiento de datos
extracción de datos
datos semi-estructurados
calidad de datos
medidas de calidad
wrappers
spellingShingle Ciencias Informáticas
informática y tratamiento de datos
extracción de datos
datos semi-estructurados
calidad de datos
medidas de calidad
wrappers
Vargas, Alejandro
Sánchez Rivero, David
Valdéz, Ángel
Bernechea, Miguel
Castillo, Natalia
Colqui, Reinaldo
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
topic_facet Ciencias Informáticas
informática y tratamiento de datos
extracción de datos
datos semi-estructurados
calidad de datos
medidas de calidad
wrappers
description La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, programas para extracción de datos de la web, cumplen tal función, y pueden ser generados, mediante herramientas, en forma automática o desarrollados en forma artesanal (utilizando los lenguajes de programación python o perl, por ejemplo). Los wrappers son los encargados de transformar la información semi-estructurada (presente en un sitio web) en información estructurada, a través del lenguaje XML (eXtensible Markup Language). El carácter dinámico de los sitios web posiblemente degrade la calidad de la información extraída por los wrappers, programas que trabajan en base a ciertos criterios, como ser color, posición en la página, fuente, tags, entre otros; los cuales pueden cambiar por el dinamismo propio del sitio. Los resultados del presente trabajo, van a permitir establecer un criterio de evaluación y comparación de las calidad de los datos extraídos de un sitio web, a medida que este presenta cambio y/o modificaciones.
format Objeto de conferencia
Objeto de conferencia
author Vargas, Alejandro
Sánchez Rivero, David
Valdéz, Ángel
Bernechea, Miguel
Castillo, Natalia
Colqui, Reinaldo
author_facet Vargas, Alejandro
Sánchez Rivero, David
Valdéz, Ángel
Bernechea, Miguel
Castillo, Natalia
Colqui, Reinaldo
author_sort Vargas, Alejandro
title Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
title_short Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
title_full Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
title_fullStr Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
title_full_unstemmed Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
title_sort evaluación de la calidad de la información extraída por wrappers, de un sitio web
publishDate 2013
url http://sedici.unlp.edu.ar/handle/10915/27136
work_keys_str_mv AT vargasalejandro evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
AT sanchezriverodavid evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
AT valdezangel evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
AT bernecheamiguel evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
AT castillonatalia evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
AT colquireinaldo evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb
bdutipo_str Repositorios
_version_ 1764820467573587971