Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto

La temprana clasificación de idiomas y detección de errores gramaticales, juegan un rol fundamental tanto en el procesamiento de texto en lenguaje natural (Natural Language Processing - NLP) como en procesadores de texto convencionales. Para procesar una palabra gramaticalmente se requiere primero c...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Hohendahl, Andres T., Zelasco, José F.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2006
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/20745
Aporte de:
id I19-R120-10915-20745
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Algoritmos eficientes
Intelligent agents
detección temprana de errore
Algorithms
clasificación idiomática
Languages
lenguaje natural
spellingShingle Ciencias Informáticas
Algoritmos eficientes
Intelligent agents
detección temprana de errore
Algorithms
clasificación idiomática
Languages
lenguaje natural
Hohendahl, Andres T.
Zelasco, José F.
Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
topic_facet Ciencias Informáticas
Algoritmos eficientes
Intelligent agents
detección temprana de errore
Algorithms
clasificación idiomática
Languages
lenguaje natural
description La temprana clasificación de idiomas y detección de errores gramaticales, juegan un rol fundamental tanto en el procesamiento de texto en lenguaje natural (Natural Language Processing - NLP) como en procesadores de texto convencionales. Para procesar una palabra gramaticalmente se requiere primero clasificarla, lo cual implica búsquedas en varios diccionarios para el caso de texto multilingual. Esto implica el uso de recursos importantes, en especial cuando las palabras no se encuentran, por tener errores de algún tipo. Se ha sintetizado un conjunto de algoritmos sencillos, que utilizan las propiedades de las distribuciones de pares de letras de cada idioma. Logramos simultáneamente tanto la clasificación estadística como la detección temprana de errores gramaticales, ahorrando recursos en etapas posteriores. Estos mecanismos proveen un rechazo estadístico de errores y poseen la ventaja de requerir escasos recursos de procesamiento, datos y memoria. El sistema es apto para ser aplicado en las etapas iniciales de procesamiento de texto, mitigando la pesada tarea de búsquedas innecesarias y clasificaciones estériles, en etapas posteriores.
format Objeto de conferencia
Objeto de conferencia
author Hohendahl, Andres T.
Zelasco, José F.
author_facet Hohendahl, Andres T.
Zelasco, José F.
author_sort Hohendahl, Andres T.
title Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
title_short Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
title_full Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
title_fullStr Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
title_full_unstemmed Algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
title_sort algoritmos eficientes para detección temprana de errores y clasificación idiomática para uso en procesamiento de lenguaje natural y texto
publishDate 2006
url http://sedici.unlp.edu.ar/handle/10915/20745
work_keys_str_mv AT hohendahlandrest algoritmoseficientesparadetecciontempranadeerroresyclasificacionidiomaticaparausoenprocesamientodelenguajenaturalytexto
AT zelascojosef algoritmoseficientesparadetecciontempranadeerroresyclasificacionidiomaticaparausoenprocesamientodelenguajenaturalytexto
bdutipo_str Repositorios
_version_ 1764820464826318851