Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias
Escuela de Altos Estudios Sociales - Universidad Nacional de San Martín - International Development Research Centre
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Artículos |
| Lenguaje: | Español |
| Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Sociales. Instituto de Investigaciones Gino Germani
2021
|
| Acceso en línea: | https://publicaciones.sociales.uba.ar/index.php/revistacomunicacion/article/view/6627 http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=compols&d=3_2021-3_6_htm |
| Aporte de: |
| id |
I28-R145-3_2021-3_6_htm |
|---|---|
| record_format |
dspace |
| spelling |
I28-R145-3_2021-3_6_htm2022-09-30 Escuela de Altos Estudios Sociales - Universidad Nacional de San Martín - International Development Research Centre Florencia Nathalia Piñeyrúa 2021 Este trabajo explora la aplicación de técnicas de procesamiento de lenguaje natural y web scraping para el estudio de contenido de noticias digitales a gran escala. Para ello, trabajamos con datos primarios construidos a partir de la técnica de web scraping utilizando como soporte empírico las noticias publicadas desde julio a septiembre 2019 en los portales Clarín , La Nación, Infobae, Página 12, Télam, Perfil , Crónica y Minuto Uno. En el procesamiento del corpus empleamos la técnica de procesamiento de lenguaje natural para la detección de tópicos con la implementación del método Latent Dirichlet Allocation (LDA). Los resultados muestran que los principales tópicos de la agenda mediática digital durante el contexto de las elecciones Primarias Abiertas Simultáneas y Obligatorias son las elecciones, los espectáculos, el deporte, la seguridad y la política exterior. El caso securitario es un tópico estable y relevante de la agenda mediática digital, aunque su prevalencia no aumenta durante el mes electoral. La conclusión principal es que la combinación de las técnicas web scraping y procesamiento de lenguaje natural pueden ser útiles para incrementar la escalabilidad (aumentar la captura de información y reducir los tiempos de selección y análisis de tópicos) en los estudios de contenido de noticias. Palabras clave: tópicos, procesamiento de lenguaje natural, web scraping y noticias digitales. Abstract: This paper explores the application of natural language processing and web scraping techniques for the study of large-scale digital news content. For this purpose, we work with primary data constructed from the web scraping technique using as empirical support the news published from July to September 2019 in the portals Clarín, La Nación, Infobae, Página 12, Télam, Perfil, Crónica and Minuto Uno. In the corpus processing we employed the natural language processing technique for topic detection with the implementation of the Latent Dirichlet Allocation (LDA) method. The results show that the main topics of the digital media agenda during the context of the Simultaneous and Mandatory Open Primary Elections are elections, entertainment, sports, security and foreign policy. The security case is a stable and relevant topic of the digital media agenda, although its prevalence does not increase during the electoral month. The main conclusion is that the combination of web scraping and natural language processing techniques can be useful to increase scalability (increase information capture and reduce topic selection and analysis times) in news content studies Keywords: topics, natural language processing, web scraping techniques and digital news application/pdf https://publicaciones.sociales.uba.ar/index.php/revistacomunicacion/article/view/6627 es Universidad de Buenos Aires. Facultad de Ciencias Sociales. Instituto de Investigaciones Gino Germani Revista Comunicación, Política y Seguridad, no. 3 26837374 Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias Artículos http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=compols&d=3_2021-3_6_htm |
| institution |
Universidad de Buenos Aires |
| institution_str |
I-28 |
| repository_str |
R-145 |
| collection |
Repositorio Digital de la Universidad de Buenos Aires (UBA) |
| language |
Español |
| orig_language_str_mv |
es |
| description |
Escuela de Altos Estudios Sociales - Universidad Nacional de San Martín - International Development Research Centre |
| format |
Artículos |
| author |
Florencia Nathalia Piñeyrúa |
| spellingShingle |
Florencia Nathalia Piñeyrúa Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| author_facet |
Florencia Nathalia Piñeyrúa |
| author_sort |
Florencia Nathalia Piñeyrúa |
| title |
Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| title_short |
Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| title_full |
Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| title_fullStr |
Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| title_full_unstemmed |
Aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| title_sort |
aportes desde el procesamiento de lenguaje natural para incrementar la escalabilidad en los estudios sobre tópicos de noticias digitales securitarias |
| publisher |
Universidad de Buenos Aires. Facultad de Ciencias Sociales. Instituto de Investigaciones Gino Germani |
| publishDate |
2021 |
| url |
https://publicaciones.sociales.uba.ar/index.php/revistacomunicacion/article/view/6627 http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=compols&d=3_2021-3_6_htm |
| work_keys_str_mv |
AT florencianathaliapineyrua aportesdesdeelprocesamientodelenguajenaturalparaincrementarlaescalabilidadenlosestudiossobretopicosdenoticiasdigitalessecuritarias |
| _version_ |
1766025729562116096 |