Modelo de extracción automática de información a partir de tablas HTML
Este trabajo presenta un modelo de extracción e integración de información contenida dentro de tablas de tipo HTML, el modelo de extracción de información se apoya en un conjunto de heurísticas y reglas de deducción. Para determinar este conjunto de reglas se determino una detección rigurosa de tabl...
Autor principal: | |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2004
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/22509 |
Aporte de: |
id |
I19-R120-10915-22509 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas Extracción de Información información Intelligent agents ARTIFICIAL INTELLIGENCE Wrapper Heurísticas DTD XML HTML |
spellingShingle |
Ciencias Informáticas Extracción de Información información Intelligent agents ARTIFICIAL INTELLIGENCE Wrapper Heurísticas DTD XML HTML Suarez Baron, Marco Javier Modelo de extracción automática de información a partir de tablas HTML |
topic_facet |
Ciencias Informáticas Extracción de Información información Intelligent agents ARTIFICIAL INTELLIGENCE Wrapper Heurísticas DTD XML HTML |
description |
Este trabajo presenta un modelo de extracción e integración de información contenida dentro de tablas de tipo HTML, el modelo de extracción de información se apoya en un conjunto de heurísticas y reglas de deducción. Para determinar este conjunto de reglas se determino una detección rigurosa de tablas y elementos de tablas HTML según su tipo de estructura y complejidad. El propósito de la investigación es extractar e integrar la información con el propósito de generar información estructurada bajo la forma documentos de tipo XML. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Suarez Baron, Marco Javier |
author_facet |
Suarez Baron, Marco Javier |
author_sort |
Suarez Baron, Marco Javier |
title |
Modelo de extracción automática de información a partir de tablas HTML |
title_short |
Modelo de extracción automática de información a partir de tablas HTML |
title_full |
Modelo de extracción automática de información a partir de tablas HTML |
title_fullStr |
Modelo de extracción automática de información a partir de tablas HTML |
title_full_unstemmed |
Modelo de extracción automática de información a partir de tablas HTML |
title_sort |
modelo de extracción automática de información a partir de tablas html |
publishDate |
2004 |
url |
http://sedici.unlp.edu.ar/handle/10915/22509 |
work_keys_str_mv |
AT suarezbaronmarcojavier modelodeextraccionautomaticadeinformacionapartirdetablashtml |
bdutipo_str |
Repositorios |
_version_ |
1764820465885380608 |