Normalización e identificación de objetos duplicados sobre contenido extraído de la web

La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera ma...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Mastronardi, Gonzalo
Otros Autores: Fernández, Alejandro
Formato: Tesis Tesis de grado
Lenguaje:Español
Publicado: 2024
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/165308
Aporte de:
id I19-R120-10915-165308
record_format dspace
spelling I19-R120-10915-1653082024-04-26T04:08:30Z http://sedici.unlp.edu.ar/handle/10915/165308 Normalización e identificación de objetos duplicados sobre contenido extraído de la web Mastronardi, Gonzalo 2024-04-18 2024 2024-04-25T15:49:55Z Fernández, Alejandro es Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. Codirector: Sergio Firmenich Licenciado en Sistemas Universidad Nacional de La Plata Facultad de Informática Tesis Tesis de grado http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Informática
Web semántica
Información
Extracción de objetos
Calidad de datos
Framework
Normalización de objetos
Identificación de duplicados
Dbpedia
spellingShingle Informática
Web semántica
Información
Extracción de objetos
Calidad de datos
Framework
Normalización de objetos
Identificación de duplicados
Dbpedia
Mastronardi, Gonzalo
Normalización e identificación de objetos duplicados sobre contenido extraído de la web
topic_facet Informática
Web semántica
Información
Extracción de objetos
Calidad de datos
Framework
Normalización de objetos
Identificación de duplicados
Dbpedia
description La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas.
author2 Fernández, Alejandro
author_facet Fernández, Alejandro
Mastronardi, Gonzalo
format Tesis
Tesis de grado
author Mastronardi, Gonzalo
author_sort Mastronardi, Gonzalo
title Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_short Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_full Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_fullStr Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_full_unstemmed Normalización e identificación de objetos duplicados sobre contenido extraído de la web
title_sort normalización e identificación de objetos duplicados sobre contenido extraído de la web
publishDate 2024
url http://sedici.unlp.edu.ar/handle/10915/165308
work_keys_str_mv AT mastronardigonzalo normalizacioneidentificaciondeobjetosduplicadossobrecontenidoextraidodelaweb
_version_ 1807223010957983744