Generación automática de una base de datos desde documentos de la web

El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurístic...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Motz, Regina, Wonsever, Dina, Perelló, Fernando, Ferreiro, Jaime
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2000
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/23569
Aporte de:
id I19-R120-10915-23569
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Base de Datos
documento HTML
mapeo
extracción de información
spellingShingle Ciencias Informáticas
Base de Datos
documento HTML
mapeo
extracción de información
Motz, Regina
Wonsever, Dina
Perelló, Fernando
Ferreiro, Jaime
Generación automática de una base de datos desde documentos de la web
topic_facet Ciencias Informáticas
Base de Datos
documento HTML
mapeo
extracción de información
description El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurísticas para la interpretación de títulos y tablas. Mediante este mecanismo se construye automáticamente un mapeo entre elementos de un documento HTML y las entidades del dominio del usuario. Utilizando este mapeo, se transfiere la información extraída de la página Web a una base de datos local.
format Objeto de conferencia
Objeto de conferencia
author Motz, Regina
Wonsever, Dina
Perelló, Fernando
Ferreiro, Jaime
author_facet Motz, Regina
Wonsever, Dina
Perelló, Fernando
Ferreiro, Jaime
author_sort Motz, Regina
title Generación automática de una base de datos desde documentos de la web
title_short Generación automática de una base de datos desde documentos de la web
title_full Generación automática de una base de datos desde documentos de la web
title_fullStr Generación automática de una base de datos desde documentos de la web
title_full_unstemmed Generación automática de una base de datos desde documentos de la web
title_sort generación automática de una base de datos desde documentos de la web
publishDate 2000
url http://sedici.unlp.edu.ar/handle/10915/23569
work_keys_str_mv AT motzregina generacionautomaticadeunabasededatosdesdedocumentosdelaweb
AT wonseverdina generacionautomaticadeunabasededatosdesdedocumentosdelaweb
AT perellofernando generacionautomaticadeunabasededatosdesdedocumentosdelaweb
AT ferreirojaime generacionautomaticadeunabasededatosdesdedocumentosdelaweb
bdutipo_str Repositorios
_version_ 1764820465892720642