Método de corrección ortográfica basado en trigramas y distancia de edición

En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera e...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Bordignon, Fernando Raúl Alfredo, Tolosa, Gabriel Hernán, Peri, Jorge Alberto, Barrientos, Diego
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2005
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/21174
Aporte de:
Descripción
Sumario:En este trabajo se exponen los primeros resultados obtenidos de evaluación de un método de corrección ortográfica. Éste permite identificar errores y generar una lista de posibles reemplazos ordenada de acuerdo a la distancia que las sugerencias mantienen con la palabra incorrecta. El método opera en dos etapas de procesamiento. Primero, mediante la utilización de un filtro basado en trigramas se construye una lista de términos candidatos; luego, se ordena la lista utilizando la métrica distancia de edición. Los primeros resultados muestran el método basado en trigramas es una alternativa válida para la corrección de errores de ortografía, alcanzando un rendimiento cercano al 81%. Especialmente, se debe considerar que se trata de un corrector de ortografía de propósito general basado en palabras aisladas y sin ningún tipo de información del contexto.