Caracterización de documentos utilizando técnicas de minería de textos

Obtener el conjunto de términos más representativos de un documento es una tarea importante, ya que permite caracterizarlo y simplificar los procesos de búsqueda y recuperación. En este trabajo se presenta un nuevo método que, sin importar el idioma en el que el documento esté escrito, permite extr...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Aquino, Germán Osvaldo
Otros Autores: Lanzarini, Laura Cristina
Formato: Tesis Tesis de grado
Lenguaje:Español
Publicado: 2013
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/63166
Aporte de:
id I19-R120-10915-63166
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
documentos
Data mining
minería de datos
extracción de palabras clave
redes neuronales
aprendizaje automático
spellingShingle Ciencias Informáticas
documentos
Data mining
minería de datos
extracción de palabras clave
redes neuronales
aprendizaje automático
Aquino, Germán Osvaldo
Caracterización de documentos utilizando técnicas de minería de textos
topic_facet Ciencias Informáticas
documentos
Data mining
minería de datos
extracción de palabras clave
redes neuronales
aprendizaje automático
description Obtener el conjunto de términos más representativos de un documento es una tarea importante, ya que permite caracterizarlo y simplificar los procesos de búsqueda y recuperación. En este trabajo se presenta un nuevo método que, sin importar el idioma en el que el documento esté escrito, permite extraer el conjunto de palabras clave más adecuado. Su funcionamiento se basa en una Red Neuronal que, luego de ser entrenada, es capaz de decidir para cada término del documento si se trata de una palabra clave o no. El ingreso del documento a la Red Neuronal implicó la definición de una representación numérica adecuada que permite medir la participación de un término dentro del documento. El método propuesto fue medido sobre una base de datos de artículos científicos publicados en WICC entre los años 1999 y 2012 demostrando un desempeño superior al de KEA, uno de los algoritmos de extracción de palabras clave más citados en la bibliografía.
author2 Lanzarini, Laura Cristina
author_facet Lanzarini, Laura Cristina
Aquino, Germán Osvaldo
format Tesis
Tesis de grado
author Aquino, Germán Osvaldo
author_sort Aquino, Germán Osvaldo
title Caracterización de documentos utilizando técnicas de minería de textos
title_short Caracterización de documentos utilizando técnicas de minería de textos
title_full Caracterización de documentos utilizando técnicas de minería de textos
title_fullStr Caracterización de documentos utilizando técnicas de minería de textos
title_full_unstemmed Caracterización de documentos utilizando técnicas de minería de textos
title_sort caracterización de documentos utilizando técnicas de minería de textos
publishDate 2013
url http://sedici.unlp.edu.ar/handle/10915/63166
work_keys_str_mv AT aquinogermanosvaldo caracterizaciondedocumentosutilizandotecnicasdemineriadetextos
bdutipo_str Repositorios
_version_ 1764820480532938752