Evaluación de la calidad de la Información extraída por wrappers, de un sitio web
La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, program...
Guardado en:
| Autores principales: | , , , , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2013
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/27136 |
| Aporte de: |
| id |
I19-R120-10915-27136 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Ciencias Informáticas informática y tratamiento de datos extracción de datos datos semi-estructurados calidad de datos medidas de calidad wrappers |
| spellingShingle |
Ciencias Informáticas informática y tratamiento de datos extracción de datos datos semi-estructurados calidad de datos medidas de calidad wrappers Vargas, Alejandro Sánchez Rivero, David Valdéz, Ángel Bernechea, Miguel Castillo, Natalia Colqui, Reinaldo Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| topic_facet |
Ciencias Informáticas informática y tratamiento de datos extracción de datos datos semi-estructurados calidad de datos medidas de calidad wrappers |
| description |
La complejidad creciente de la estructura y la cantidad de datos presentes en un sitio web determinado, torna necesaria la existencia de herramientas para la recuperación de información (RI), la cual se considera pertinente y adecuada, para su posterior análisis. En tal sentido los wrappers, programas para extracción de datos de la web, cumplen tal función, y pueden ser generados, mediante herramientas, en forma automática o desarrollados en forma artesanal (utilizando los lenguajes de programación python o perl, por ejemplo). Los wrappers son los encargados de transformar la información semi-estructurada (presente en un sitio web) en información estructurada, a través del lenguaje XML (eXtensible Markup Language).
El carácter dinámico de los sitios web posiblemente degrade la calidad de la información extraída por los wrappers, programas que trabajan en base a ciertos criterios, como ser color, posición en la página, fuente, tags, entre otros; los cuales pueden cambiar por el dinamismo propio del sitio.
Los resultados del presente trabajo, van a permitir establecer un criterio de evaluación y comparación de las calidad de los datos extraídos de un sitio web, a medida que este presenta cambio y/o modificaciones. |
| format |
Objeto de conferencia Objeto de conferencia |
| author |
Vargas, Alejandro Sánchez Rivero, David Valdéz, Ángel Bernechea, Miguel Castillo, Natalia Colqui, Reinaldo |
| author_facet |
Vargas, Alejandro Sánchez Rivero, David Valdéz, Ángel Bernechea, Miguel Castillo, Natalia Colqui, Reinaldo |
| author_sort |
Vargas, Alejandro |
| title |
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| title_short |
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| title_full |
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| title_fullStr |
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| title_full_unstemmed |
Evaluación de la calidad de la Información extraída por wrappers, de un sitio web |
| title_sort |
evaluación de la calidad de la información extraída por wrappers, de un sitio web |
| publishDate |
2013 |
| url |
http://sedici.unlp.edu.ar/handle/10915/27136 |
| work_keys_str_mv |
AT vargasalejandro evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb AT sanchezriverodavid evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb AT valdezangel evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb AT bernecheamiguel evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb AT castillonatalia evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb AT colquireinaldo evaluaciondelacalidaddelainformacionextraidaporwrappersdeunsitioweb |
| bdutipo_str |
Repositorios |
| _version_ |
1764820467573587971 |