Normalización e identificación de objetos duplicados sobre contenido extraído de la web
La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera ma...
Guardado en:
| Autor principal: | |
|---|---|
| Otros Autores: | |
| Formato: | Tesis Tesis de grado |
| Lenguaje: | Español |
| Publicado: |
2024
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/165308 |
| Aporte de: |
| id |
I19-R120-10915-165308 |
|---|---|
| record_format |
dspace |
| spelling |
I19-R120-10915-1653082024-04-26T04:08:30Z http://sedici.unlp.edu.ar/handle/10915/165308 Normalización e identificación de objetos duplicados sobre contenido extraído de la web Mastronardi, Gonzalo 2024-04-18 2024 2024-04-25T15:49:55Z Fernández, Alejandro es Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. Codirector: Sergio Firmenich Licenciado en Sistemas Universidad Nacional de La Plata Facultad de Informática Tesis Tesis de grado http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf |
| institution |
Universidad Nacional de La Plata |
| institution_str |
I-19 |
| repository_str |
R-120 |
| collection |
SEDICI (UNLP) |
| language |
Español |
| topic |
Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia |
| spellingShingle |
Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia Mastronardi, Gonzalo Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| topic_facet |
Informática Web semántica Información Extracción de objetos Calidad de datos Framework Normalización de objetos Identificación de duplicados Dbpedia |
| description |
La web es la principal fuente de información disponible, aunque los datos carecen de estructura y significado para las maquinas. La web semántica emerge para solucionar esto, pero su adopción es lenta, y la construcción de aplicaciones que utilicen los datos de la web implica extraerlos de manera manual. Dada la imprecisión de estas herramientas, se propuso, en primera instancia, la construcción un framework de normalización, y luego, un segundo framework de identificación de duplicados, con el objetivo de recolectar, estructurar y normalizar información dispersa, otorgándole sentido para las maquinas. |
| author2 |
Fernández, Alejandro |
| author_facet |
Fernández, Alejandro Mastronardi, Gonzalo |
| format |
Tesis Tesis de grado |
| author |
Mastronardi, Gonzalo |
| author_sort |
Mastronardi, Gonzalo |
| title |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| title_short |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| title_full |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| title_fullStr |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| title_full_unstemmed |
Normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| title_sort |
normalización e identificación de objetos duplicados sobre contenido extraído de la web |
| publishDate |
2024 |
| url |
http://sedici.unlp.edu.ar/handle/10915/165308 |
| work_keys_str_mv |
AT mastronardigonzalo normalizacioneidentificaciondeobjetosduplicadossobrecontenidoextraidodelaweb |
| _version_ |
1807223010957983744 |