Unconstrained text detection in Manga

La detección y reconocimiento de texto sin restricciones es un problema abierto en la investigación. El texto en comics presenta estilos inusuales que plantean muchos desafíos para su detección. Este trabajo apunta a identificar caracteres de texto a nivel de pixel en un género de comics con estilos...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Del Gobbo, Julián
Otros Autores: Matuk Herrera, Rosana Isabel
Formato: Tesis de grado publishedVersion
Lenguaje:Inglés
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2020
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nCOM000576_DelGobbo
https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000576_DelGobbo_oai
Aporte de:
Descripción
Sumario:La detección y reconocimiento de texto sin restricciones es un problema abierto en la investigación. El texto en comics presenta estilos inusuales que plantean muchos desafíos para su detección. Este trabajo apunta a identificar caracteres de texto a nivel de pixel en un género de comics con estilos de texto muy sofisticados: el manga Japonés. Para superar la falta de dataset de manga con anotaciones por carácter, creamos nuestro propio. La mayoría de la literatura en detección de texto utiliza métricas basadas en coordenadas de rectángulos contenedores, los cuales son inadecuados para evaluar a nivel de píxel. Entonces, implementamos métricas especiales para evaluar el desempeño. Usando estos recursos, diseñamos y evaluamos un modelo de redes neuronales profundas, superando métodos actuales de detección de texto en manga en la mayoría de las métricas.