Modelo de extracción automática de información a partir de tablas HTML

Este trabajo presenta un modelo de extracción e integración de información contenida dentro de tablas de tipo HTML, el modelo de extracción de información se apoya en un conjunto de heurísticas y reglas de deducción. Para determinar este conjunto de reglas se determino una detección rigurosa de tabl...

Descripción completa

Detalles Bibliográficos
Autor principal: Suarez Baron, Marco Javier
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2004
Materias:
DTD
XML
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/22509
Aporte de:
id I19-R120-10915-22509
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Extracción de Información
información
Intelligent agents
ARTIFICIAL INTELLIGENCE
Wrapper
Heurísticas
DTD
XML
HTML
spellingShingle Ciencias Informáticas
Extracción de Información
información
Intelligent agents
ARTIFICIAL INTELLIGENCE
Wrapper
Heurísticas
DTD
XML
HTML
Suarez Baron, Marco Javier
Modelo de extracción automática de información a partir de tablas HTML
topic_facet Ciencias Informáticas
Extracción de Información
información
Intelligent agents
ARTIFICIAL INTELLIGENCE
Wrapper
Heurísticas
DTD
XML
HTML
description Este trabajo presenta un modelo de extracción e integración de información contenida dentro de tablas de tipo HTML, el modelo de extracción de información se apoya en un conjunto de heurísticas y reglas de deducción. Para determinar este conjunto de reglas se determino una detección rigurosa de tablas y elementos de tablas HTML según su tipo de estructura y complejidad. El propósito de la investigación es extractar e integrar la información con el propósito de generar información estructurada bajo la forma documentos de tipo XML.
format Objeto de conferencia
Objeto de conferencia
author Suarez Baron, Marco Javier
author_facet Suarez Baron, Marco Javier
author_sort Suarez Baron, Marco Javier
title Modelo de extracción automática de información a partir de tablas HTML
title_short Modelo de extracción automática de información a partir de tablas HTML
title_full Modelo de extracción automática de información a partir de tablas HTML
title_fullStr Modelo de extracción automática de información a partir de tablas HTML
title_full_unstemmed Modelo de extracción automática de información a partir de tablas HTML
title_sort modelo de extracción automática de información a partir de tablas html
publishDate 2004
url http://sedici.unlp.edu.ar/handle/10915/22509
work_keys_str_mv AT suarezbaronmarcojavier modelodeextraccionautomaticadeinformacionapartirdetablashtml
bdutipo_str Repositorios
_version_ 1764820465885380608