Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus

The aim of this paper is to compare the use of free language tags, taken in our case from specialized blogs on information sciences, against the unstructured controlled language of keywords lists, for verifying which of them is the best source of new terminology for the Librarianship Thesaurus and D...

Descripción completa

Detalles Bibliográficos
Autores principales: Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid, Rodríguez, Eva Méndez; Universidad Carlos III de Madrid, Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas
Formato: Artículo publishedVersion
Lenguaje:Español
Publicado: Información, cultura y sociedad 2017
Materias:
Acceso en línea:http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/3652
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=biblioinfo&d=3652_oai
Aporte de:
id I28-R145-3652_oai
record_format dspace
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-145
collection Repositorio Digital de la Universidad de Buenos Aires (UBA)
language Español
orig_language_str_mv spa
topic Social tagging; Thesauri maintenance; Blogs; Library and Information Science; Terminological extraction
Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y Documentación; Extracción terminológica
spellingShingle Social tagging; Thesauri maintenance; Blogs; Library and Information Science; Terminological extraction
Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y Documentación; Extracción terminológica
Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid
Rodríguez, Eva Méndez; Universidad Carlos III de Madrid
Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas
Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
topic_facet Social tagging; Thesauri maintenance; Blogs; Library and Information Science; Terminological extraction
Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y Documentación; Extracción terminológica
description The aim of this paper is to compare the use of free language tags, taken in our case from specialized blogs on information sciences, against the unstructured controlled language of keywords lists, for verifying which of them is the best source of new terminology for the Librarianship Thesaurus and Documentation. To do this, authors’ labels were extracted from 127 blogs on librarianship and information science using web scraping techniques, and were compared with descriptors and identifiers lists of the ISOC library and documentation database (ISOC-BD). The results of the analysis of authors’ tags in blogs contribute with 186 new terms, while the database lists only 130 terms. It is concluded that free language tags could be a better and faster way for contributing new terminology to controlled vocabularies than unstructured controlled language lists.
format Artículo
publishedVersion
author Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid
Rodríguez, Eva Méndez; Universidad Carlos III de Madrid
Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas
author_facet Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid
Rodríguez, Eva Méndez; Universidad Carlos III de Madrid
Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas
author_sort Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid
title Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
title_short Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
title_full Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
title_fullStr Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
title_full_unstemmed Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus
title_sort social tagging and blog-scraping as an alternative for updating controlled vocabularies: practical application to a library and information science thesaurus
publisher Información, cultura y sociedad
publishDate 2017
url http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/3652
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=biblioinfo&d=3652_oai
work_keys_str_mv AT mochonbezaresgonzalouniversidadcarlosiiidemadrid socialtaggingandblogscrapingasanalternativeforupdatingcontrolledvocabulariespracticalapplicationtoalibraryandinformationsciencethesaurus
AT rodriguezevamendezuniversidadcarlosiiidemadrid socialtaggingandblogscrapingasanalternativeforupdatingcontrolledvocabulariespracticalapplicationtoalibraryandinformationsciencethesaurus
AT rojoangelasorliconsejosuperiordeinvestigacioncientificas socialtaggingandblogscrapingasanalternativeforupdatingcontrolledvocabulariespracticalapplicationtoalibraryandinformationsciencethesaurus
AT mochonbezaresgonzalouniversidadcarlosiiidemadrid etiquetadosocialyblogscrapingcomoalternativaparalaactualizaciondevocabularioscontroladosaplicacionpracticaauntesaurodebiblioteconomiaydocumentacion
AT rodriguezevamendezuniversidadcarlosiiidemadrid etiquetadosocialyblogscrapingcomoalternativaparalaactualizaciondevocabularioscontroladosaplicacionpracticaauntesaurodebiblioteconomiaydocumentacion
AT rojoangelasorliconsejosuperiordeinvestigacioncientificas etiquetadosocialyblogscrapingcomoalternativaparalaactualizaciondevocabularioscontroladosaplicacionpracticaauntesaurodebiblioteconomiaydocumentacion
_version_ 1824358610734415872
spelling I28-R145-3652_oai2024-12-10 Mochón Bezares, Gonzalo; Universidad Carlos III de Madrid Rodríguez, Eva Méndez; Universidad Carlos III de Madrid Rojo, Ángela Sorli; Consejo Superior de Investigación Científicas 2017-10-17 The aim of this paper is to compare the use of free language tags, taken in our case from specialized blogs on information sciences, against the unstructured controlled language of keywords lists, for verifying which of them is the best source of new terminology for the Librarianship Thesaurus and Documentation. To do this, authors’ labels were extracted from 127 blogs on librarianship and information science using web scraping techniques, and were compared with descriptors and identifiers lists of the ISOC library and documentation database (ISOC-BD). The results of the analysis of authors’ tags in blogs contribute with 186 new terms, while the database lists only 130 terms. It is concluded that free language tags could be a better and faster way for contributing new terminology to controlled vocabularies than unstructured controlled language lists. El objetivo de este artículo es comparar las etiquetas en lenguaje libre, tomadas en nuestro caso de blogs especializados en ciencias de la información (information sciences), frente al lenguaje controlado no estructurado de las listas de palabras clave, con el fin de comprobar cuál de estos dos es una mejor fuente de nueva terminología para el Tesauro de Biblioteconomía y Documentación. Para ello, se extrajeron las etiquetas de autor de 127 blogs sobre biblioteconomía y documentación mediante técnicas de web scraping, y se compararon con los listados de descriptores e identificadores de la base de datos ISOC Biblioteconomía y Documentación (ISOC-BD). El análisis de las etiquetas de autor de blogs ha aportado 186 nuevos términos, mientras que los listados de la base de datos han proporcionado 130términos. Se concluye que las etiquetas en lenguaje libre pueden ser una mejor y más rápida vía de aporte de nueva terminología a los vocabularios controlados que los listados de lenguaje controlado no estructurado. application/pdf text/html http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/3652 spa Información, cultura y sociedad Información, cultura y sociedad http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/3652/3572 http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/3652/3592 Authors publishing in this journal acknowledge the conditions below:Authors retain the copyright of their work while they transfer the right of the first publishing to the journal, under the Creative Commons Attribution-Noncommercial-No Derivative Works 3.0 Unported Licence, which allows third parties to reproduce them under the condition that express mention is given to the author and to its original publication in the journal.Authors may enter into other contractual and independent arrangements for the non-exclusive distribution of the version of the article published in this journal (for instance, it can be published in an institutional repository or in a book). In any case, an express mention should be given to its first publication in the journal.It is permitted and encouraged to publish online the articles (for example, on institutional or personal pages). Los autores/as que publiquen en esta revista aceptan las siguientes condiciones: Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la Licencia Creative Commons Atribución-NoComercial-SinDerivadas 3.0 Unported, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales). Información, cultura y sociedad; núm. 37 (2017); 13-26 Información, cultura y sociedad; núm. 37 (2017); 13-26 1851-1740 1514-8327 Social tagging; Thesauri maintenance; Blogs; Library and Information Science; Terminological extraction Etiquetado social; Mantenimiento de tesauros; Blogs; Biblioteconomía y Documentación; Extracción terminológica Social tagging and blog-scraping as an alternative for updating controlled vocabularies: Practical application to a library and information science thesaurus Etiquetado social y blog-scraping como alternativa para la actualización de vocabularios controlados: aplicación práctica a un tesauro de Biblioteconomía y Documentación info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=biblioinfo&d=3652_oai