Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información
A medida que aumenta la cantidad de información contenida y disponible en la web, analizarla, descubrir patrones y conocimiento informativo demanda grandes cantidades de tiempo. Los buscadores y los motores de bases de datos pueden facilitar en parte la tarea de encontrar contenido adecuado, pero en...
Guardado en:
Autores principales: | , |
---|---|
Formato: | Objeto de conferencia |
Lenguaje: | Español |
Publicado: |
2021
|
Materias: | |
Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/120104 |
Aporte de: |
id |
I19-R120-10915-120104 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de La Plata |
institution_str |
I-19 |
repository_str |
R-120 |
collection |
SEDICI (UNLP) |
language |
Español |
topic |
Ciencias Informáticas Web Mining Text Mining Procesamiento de Lenguaje Natural Topic modeling Recuperación de información |
spellingShingle |
Ciencias Informáticas Web Mining Text Mining Procesamiento de Lenguaje Natural Topic modeling Recuperación de información Medrano, José Federico Barriento, Valeria Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
topic_facet |
Ciencias Informáticas Web Mining Text Mining Procesamiento de Lenguaje Natural Topic modeling Recuperación de información |
description |
A medida que aumenta la cantidad de información contenida y disponible en la web, analizarla, descubrir patrones y conocimiento informativo demanda grandes cantidades de tiempo. Los buscadores y los motores de bases de datos pueden facilitar en parte la tarea de encontrar contenido adecuado, pero en sitios web grandes, donde los resultados de las búsquedas se cuentan por miles o decenas de miles es necesario aplicar enfoques avanzados que permitan relacionar el contenido buscado de algún modo. Este trabajo plantea la aplicación de técnicas de <i>Web Mining</i> y <i>Text Mining</i> para procesar grandes cantidades de información de sitios web de noticias para ofrecer contenido relevante y relacionado a partir de una búsqueda inicial. Una de las técnicas a emplear será el modelado temático, que permitirá por un lado conocer los distintos temas o tópicos que tratan estas noticias y por otro lado, una vez identificados los conjuntos de temas, hallar las diversas interrelaciones entre ellos. Esto permitirá describir y analizar de un modo objetivo la información ofrecida por este tipo de portales. Del mismo modo, este trabajo también plantea el estudio y análisis de sitios web de avisos clasificados, de manera de caracterizar por un lado la oferta de inmuebles y por otro la demanda de perfiles para distintos puestos de trabajo. |
format |
Objeto de conferencia Objeto de conferencia |
author |
Medrano, José Federico Barriento, Valeria |
author_facet |
Medrano, José Federico Barriento, Valeria |
author_sort |
Medrano, José Federico |
title |
Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
title_short |
Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
title_full |
Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
title_fullStr |
Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
title_full_unstemmed |
Web Mining y Text Mining : Enfoques avanzados para analizar el contenido de grandes cantidades de información |
title_sort |
web mining y text mining : enfoques avanzados para analizar el contenido de grandes cantidades de información |
publishDate |
2021 |
url |
http://sedici.unlp.edu.ar/handle/10915/120104 |
work_keys_str_mv |
AT medranojosefederico webminingytextminingenfoquesavanzadosparaanalizarelcontenidodegrandescantidadesdeinformacion AT barrientovaleria webminingytextminingenfoquesavanzadosparaanalizarelcontenidodegrandescantidadesdeinformacion |
bdutipo_str |
Repositorios |
_version_ |
1764820449304248322 |