Reconocimiento de caracteres en imágenes no estructuradas

El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presen...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Carranza Astrada, Rodrigo Pablo
Otros Autores: Sánchez, Jorge Adrián, dir.
Formato: bachelorThesis
Lenguaje:Español
Publicado: 2016
Materias:
Acceso en línea:http://hdl.handle.net/11086/2818
Aporte de:
Descripción
Sumario:El que una computadora pueda discernir un carácter de otro en la imagen de un texto no es una tarea sencilla. El objetivo es clasificar caracteres en escenas naturales en donde las técnicas tradicionales de OCR no se pueden aplicar de forma directa (De Campos et al., 2009). En este trabajo se presenta un análisis del impacto producido en la performance de clasificación al entrenar un clasificador de caracteres con imágenes sintéticas (Wang et al., 2011). Se complementa esto realizando una análisis de performance utilizando diferentes conjuntos de entrenamiento sintéticos generados a partir del dataset público conocido como Chars74k. El resultado final de este trabajo sirve para corrobar que este tipo de datos produce un impacto positivo en la clasificación y más aún al combinar estas con datos reales.