Generación automática de una base de datos desde documentos de la web

El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurístic...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Motz, Regina, Wonsever, Dina, Perelló, Fernando, Ferreiro, Jaime
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2000
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/23569
Aporte de:
Descripción
Sumario:El objetivo central de este trabajo es la extracción de información de documentos HTML y la consolidación de esta información en una base de datos. Se propone un mecanismo basado en una ontología del dominio, en patrones sintácticos típicos para la inferencia de algunos tipos de datos y en heurísticas para la interpretación de títulos y tablas. Mediante este mecanismo se construye automáticamente un mapeo entre elementos de un documento HTML y las entidades del dominio del usuario. Utilizando este mapeo, se transfiere la información extraída de la página Web a una base de datos local.