Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto

La obtención de información a partir de un conjunto de datos o minería de datos es una tarea compleja que involucra varias etapas, tal como sucede en la minería de texto. Esta puede ser considerada como un caso particular de minería de datos donde los datos contemplan la incorporación de texto. Ambo...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Cecchini, Rocío L.
Otros Autores: Brignole, Nélida Beatriz
Formato: tesis doctoral
Lenguaje:Español
Publicado: 2010
Materias:
Acceso en línea:http://repositoriodigital.uns.edu.ar/handle/123456789/2119
Aporte de:
id I20-R126123456789-2119
record_format dspace
institution Universidad Nacional del Sur
institution_str I-20
repository_str R-126
collection Repositorio Institucional Universidad Nacional del Sur (UNS)
language Español
orig_language_str_mv spa
topic computación evolutiva
minería de datos
minería de texto
evolutionary computation
datamining
text mining
spellingShingle computación evolutiva
minería de datos
minería de texto
evolutionary computation
datamining
text mining
Cecchini, Rocío L.
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
topic_facet computación evolutiva
minería de datos
minería de texto
evolutionary computation
datamining
text mining
description La obtención de información a partir de un conjunto de datos o minería de datos es una tarea compleja que involucra varias etapas, tal como sucede en la minería de texto. Esta puede ser considerada como un caso particular de minería de datos donde los datos contemplan la incorporación de texto. Ambos procesos de minería se vuelven aun más complejos cuando nos encontramos ante grandes cúmulos de datos o texto. Es común encontrar conjuntos de datos grandes, complejos y ricos en información en áreas como medicina, comercio, ingeniería y ciencias de la computación. Simultáneamente, los avances tecnológicos han dado lugar a la acumulación de sustanciosas cantidades de documentos, artículos y texto; el ejemplo más contundente de esta clase de material es la Web, la cual se estima que alcanza más de 8.05 billones de páginas. La propuesta de esta tesis es el uso de herramientas evolutivas mono- y multi-objetivo como un soporte para algunas de las etapas de este proceso. En particular, las etapas que implican optimización y búsqueda dentro de estos grandes espacios en los cuales otros métodos serían inviables. A lo largo de la investigación se desarrollaron, evaluaron y compararon algoritmos evolutivos mono y multi-objetivo tanto para la rama de minería de datos como para la rama de minería de texto. Como caso particular dentro de minería de datos, se contempló el problema de encontrar las relaciones más relevantes entre variables dentro de distintos conjuntos de datos. Dichas relaciones, no son visibles para un experto cuando se encuentra frente a la base de datos original cruda, la cual puede contemplar miles de variables y miles de instan-cias. Para resolver este problema se propuso una metodología de dos fases. Los algoritmos desarrollados en este contexto se integraron a la primera fase de la arquitectura y fueron exitosamente utilizados como mecanismo de búsqueda masiva. Por otra parte, en el caso de minería de texto se abordó el problema de recuperar información relacionada y novedosa con respecto a un tópico de interés. Para este problema se propuso, implementó y evaluó una arquitectura que, partiendo de una descripción para el tópico de interés, evoluciona varios conjuntos de términos hacia conjuntos que logren obtener mejores documentos con respecto a dicho tema de interés y con respecto a los objetivos propuestos (por ejemplo: simi-litud, precisión, cobertura). Dentro de las técnicas evolutivas multi-objetivo propuestas, se diseñaron adaptaciones de los algoritmos basados en Pareto más prometedores reportados por la literatura y se propusieron versiones multi-objetivo agregativas. Ambos enfoques, los basados en Pareto y los agregativos, demostraron ser claramente competentes tanto para minería de datos como para minería de texto.
author2 Brignole, Nélida Beatriz
author_facet Brignole, Nélida Beatriz
Cecchini, Rocío L.
format tesis doctoral
author Cecchini, Rocío L.
author_sort Cecchini, Rocío L.
title Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
title_short Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
title_full Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
title_fullStr Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
title_full_unstemmed Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
title_sort desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
publishDate 2010
url http://repositoriodigital.uns.edu.ar/handle/123456789/2119
work_keys_str_mv AT cecchinirociol desarrollodetecnicasdecomputacionevolutivaparasoporteenmineriadedatosytexto
bdutipo_str Repositorios
_version_ 1764820505205932035