Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación

En este trabajo se muestran resultados preliminares obtenidos al aplicar la técnica de clustering basado en k-means y un modelado de tópicos usando Latent Dirichlet Allocation (LDA) sobre un corpus de registros de la base de datos Scopus utilizando paquetes del lenguaje R. El objetivo general es det...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: González, Claudia M., Varela, Sebastián, Miguel, Sandra
Formato: Objeto de conferencia Resumen
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/72173
http://47jaiio.sadio.org.ar/sites/default/files/LatinR_16.pdf
Aporte de:
id I19-R120-10915-72173
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
cienciometría
Clustering
modelado de tópicos
Latent Drichlet Allocation (LDA)
spellingShingle Ciencias Informáticas
cienciometría
Clustering
modelado de tópicos
Latent Drichlet Allocation (LDA)
González, Claudia M.
Varela, Sebastián
Miguel, Sandra
Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
topic_facet Ciencias Informáticas
cienciometría
Clustering
modelado de tópicos
Latent Drichlet Allocation (LDA)
description En este trabajo se muestran resultados preliminares obtenidos al aplicar la técnica de clustering basado en k-means y un modelado de tópicos usando Latent Dirichlet Allocation (LDA) sobre un corpus de registros de la base de datos Scopus utilizando paquetes del lenguaje R. El objetivo general es detectar aquellas áreas que permitan estimar el esfuerzo que realizan los recursos humanos de investigación de determinado lugar geográfico para abordar los problemas que son propios de ese territorio y sus habitantes. Por ello, el corpus responde a una estrategia de búsqueda que comprende la producción del gran área Ciencias Sociales & Humanas en el periodo 2010-2015, restringida a aquellos trabajos que tuvieran algún autor con afiliación argentina, además de contener Argentina (o alguna de sus variaciones explicitadas en la estrategia de búsqueda) en los campos título, resumen y palabras clave. Para el procesamiento se utilizaron los paquetes bibliometrix (2017), que sirve para realizar análisis bibliométricos y de co-citación; el paquete topicsmodels (2017) que permite implementar LDA y CTM (Correlated Topics Models); el paquete tidytext (2017) que permite aplicar algunas técnicas de procesamiento del lenguaje natural dentro de las cuales se encuentra la detección de n-gramas. En este trabajo, se procedió a sacar bigramas y se los interpretó de manera cualitativa, detectando 7 áreas (ver referencia de colores en figura 1). Se generaron los clusters mediante la técnica de K-medias y se procedió a realizar un análisis de los clusters obtenidos a la luz de las categorías que se derivaron de los bigramas. Luego se realizó lo mismo aplicando modelado de tópicos con LDA.
format Objeto de conferencia
Resumen
author González, Claudia M.
Varela, Sebastián
Miguel, Sandra
author_facet González, Claudia M.
Varela, Sebastián
Miguel, Sandra
author_sort González, Claudia M.
title Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
title_short Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
title_full Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
title_fullStr Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
title_full_unstemmed Uso de R en bibliometría: exploración de técnicas para la detección de temas locales de investigación
title_sort uso de r en bibliometría: exploración de técnicas para la detección de temas locales de investigación
publishDate 2018
url http://sedici.unlp.edu.ar/handle/10915/72173
http://47jaiio.sadio.org.ar/sites/default/files/LatinR_16.pdf
work_keys_str_mv AT gonzalezclaudiam usoderenbibliometriaexploraciondetecnicasparaladetecciondetemaslocalesdeinvestigacion
AT varelasebastian usoderenbibliometriaexploraciondetecnicasparaladetecciondetemaslocalesdeinvestigacion
AT miguelsandra usoderenbibliometriaexploraciondetecnicasparaladetecciondetemaslocalesdeinvestigacion
bdutipo_str Repositorios
_version_ 1764820483451125762