Extraccion de entidades con nombre

El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los...

Descripción completa

Detalles Bibliográficos
Autores principales: Pérez Abelleira, M. Alicia, Cardoso, Carolina A.
Formato: publishedVersion Artículo
Lenguaje:Español
Publicado: Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2012
Materias:
Acceso en línea:https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549
Aporte de:
id I49-R155-60549
record_format dspace
spelling I49-R155-605492025-02-21T12:52:21Z https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549 60549 20161201u u u0frey0103 ba spa Extraccion de entidades con nombre Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2012-12-30 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/article info:ar-repo/semantics/artículo application/pdf 1001514 Salta (province) El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre. Fil: Cardoso, Carolina A.. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Fil: Pérez Abelleira, M. Alicia. Universidad Católica de Salta. Facultad de Ingeniería; Argentina. Pérez Abelleira, M. Alicia Cardoso, Carolina A. Análisis automático de textos Base de datos a texto completo Tratamiento de textos Cuadernos de Ingeniería Creative Commons Atribución/Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) https://creativecommons.org/licenses/by-nc-sa/4.0/ info:eu-repo/semantics/openAccess Researchers Students
institution Universidad Católica de Salta
institution_str I-49
repository_str R-155
collection Repositorio Digital - Universidad Católica de Salta (UCASal)
language Español
orig_language_str_mv spa
topic Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
spellingShingle Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
Pérez Abelleira, M. Alicia
Cardoso, Carolina A.
Extraccion de entidades con nombre
topic_facet Análisis automático de textos
Base de datos a texto completo
Tratamiento de textos
description El uso de la minería de textos está aumentando en la actualidad ya que las organizaciones quieren aprovechar el potencial de la gran cantidad de información de que disponen en forma de documentos de texto u otra información no estructurada; este tipo de datos supone un porcentaje considerable de los datos con que cuentan las organizaciones. Una de las tareas integrales para la minería de textos es la extracción de entidades con nombre (NER). El presente trabajo describe los principales enfoques en uso para esta tarea, centrándose especialmente en los específicos para el aprendizaje de secuencias. Estas técnicas se aplican a un problema concreto, la extracción de información de un corpus de 8000 documentos correspondientes a resoluciones rectorales, de los que se extraen nombres de personas, diversos departamentos académicos y otras organizaciones vinculadas a la universidad. El trabajo describe la arquitectura para la gestión de información no estructurada en la que se enmarca esta tarea y de la que forma parte, en la que las entidades extraídas permiten la búsqueda semántica de información. Los experimentos muestran que los campos aleatorios condicionales (CRFS) son la técnica más adecuada para el problema de extracción de entidades con nombre.
format publishedVersion
Artículo
Artículo
author Pérez Abelleira, M. Alicia
Cardoso, Carolina A.
author_facet Pérez Abelleira, M. Alicia
Cardoso, Carolina A.
author_sort Pérez Abelleira, M. Alicia
title Extraccion de entidades con nombre
title_short Extraccion de entidades con nombre
title_full Extraccion de entidades con nombre
title_fullStr Extraccion de entidades con nombre
title_full_unstemmed Extraccion de entidades con nombre
title_sort extraccion de entidades con nombre
publisher Universidad Católica de Salta. Facultad de Ingeniería (Salta)
publishDate 2012
url https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=60549
work_keys_str_mv AT perezabelleiramalicia extracciondeentidadesconnombre
AT cardosocarolinaa extracciondeentidadesconnombre
_version_ 1826453791247958016