Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto
La obtención de información a partir de un conjunto de datos o minería de datos es una tarea compleja que involucra varias etapas, tal como sucede en la minería de texto. Esta puede ser considerada como un caso particular de minería de datos donde los datos contemplan la incorporación de texto. Ambo...
Guardado en:
| Autor principal: | |
|---|---|
| Otros Autores: | |
| Formato: | tesis doctoral |
| Lenguaje: | Español |
| Publicado: |
2010
|
| Materias: | |
| Acceso en línea: | http://repositoriodigital.uns.edu.ar/handle/123456789/2119 |
| Aporte de: |
| id |
I20-R126123456789-2119 |
|---|---|
| record_format |
dspace |
| institution |
Universidad Nacional del Sur |
| institution_str |
I-20 |
| repository_str |
R-126 |
| collection |
Repositorio Institucional Universidad Nacional del Sur (UNS) |
| language |
Español |
| orig_language_str_mv |
spa |
| topic |
computación evolutiva minería de datos minería de texto evolutionary computation datamining text mining |
| spellingShingle |
computación evolutiva minería de datos minería de texto evolutionary computation datamining text mining Cecchini, Rocío L. Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| topic_facet |
computación evolutiva minería de datos minería de texto evolutionary computation datamining text mining |
| description |
La obtención de información a partir de un conjunto de datos o minería de datos es una tarea compleja que involucra varias etapas, tal como sucede en la minería de texto. Esta puede ser considerada como un caso particular de minería de datos donde los datos contemplan la incorporación de texto. Ambos procesos de minería se vuelven aun más complejos cuando nos encontramos ante grandes cúmulos de datos o texto. Es común encontrar conjuntos de datos grandes, complejos y ricos en información en áreas como medicina, comercio, ingeniería y ciencias de la computación. Simultáneamente, los avances tecnológicos han dado lugar a la acumulación de sustanciosas cantidades de documentos, artículos y texto; el ejemplo más contundente de esta clase de material es la Web, la cual se estima que alcanza más de 8.05 billones de páginas. La propuesta de esta tesis es el uso de herramientas evolutivas mono- y multi-objetivo como un soporte para algunas de las etapas de este proceso. En particular, las etapas que implican optimización y búsqueda dentro de estos grandes espacios en los cuales otros métodos serían inviables. A lo largo de la investigación se desarrollaron, evaluaron y compararon algoritmos evolutivos mono y multi-objetivo tanto para la rama de minería de datos como para la rama de minería
de texto. Como caso particular dentro de minería de datos, se contempló el problema de encontrar las relaciones más relevantes entre variables dentro de distintos conjuntos
de datos. Dichas relaciones, no son visibles para un experto cuando se encuentra frente a la base de datos original cruda, la cual puede contemplar miles de variables y miles de instan-cias. Para resolver este problema se propuso una metodología de dos fases. Los algoritmos desarrollados en este contexto se integraron a la primera fase de la arquitectura y fueron exitosamente utilizados como mecanismo de búsqueda masiva. Por otra parte, en el caso de minería de texto se abordó el problema de recuperar información relacionada y novedosa con respecto a un tópico de interés. Para este problema se propuso, implementó y evaluó una arquitectura que, partiendo de una descripción para el tópico de interés, evoluciona varios conjuntos de términos hacia conjuntos que logren obtener mejores documentos con respecto a dicho tema de interés y con respecto a los objetivos propuestos (por ejemplo: simi-litud, precisión, cobertura). Dentro de las técnicas evolutivas multi-objetivo propuestas, se diseñaron adaptaciones de los algoritmos basados en Pareto más prometedores reportados por la literatura y se propusieron versiones multi-objetivo agregativas. Ambos enfoques, los basados en Pareto y los agregativos, demostraron ser claramente competentes tanto para minería de datos como para minería de texto. |
| author2 |
Brignole, Nélida Beatriz |
| author_facet |
Brignole, Nélida Beatriz Cecchini, Rocío L. |
| format |
tesis doctoral |
| author |
Cecchini, Rocío L. |
| author_sort |
Cecchini, Rocío L. |
| title |
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| title_short |
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| title_full |
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| title_fullStr |
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| title_full_unstemmed |
Desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| title_sort |
desarrollo de técnicas de computación evolutiva para soporte en minería de datos y texto |
| publishDate |
2010 |
| url |
http://repositoriodigital.uns.edu.ar/handle/123456789/2119 |
| work_keys_str_mv |
AT cecchinirociol desarrollodetecnicasdecomputacionevolutivaparasoporteenmineriadedatosytexto |
| bdutipo_str |
Repositorios |
| _version_ |
1764820505205932035 |