Unconstrained text detection in Manga
La detección y reconocimiento de texto sin restricciones es un problema abierto en la investigación. El texto en comics presenta estilos inusuales que plantean muchos desafíos para su detección. Este trabajo apunta a identificar caracteres de texto a nivel de pixel en un género de comics con estilos...
Guardado en:
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Tesis de grado publishedVersion |
Lenguaje: | Inglés |
Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2020
|
Materias: | |
Acceso en línea: | https://hdl.handle.net/20.500.12110/seminario_nCOM000576_DelGobbo https://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesisg&d=seminario_nCOM000576_DelGobbo_oai |
Aporte de: |
Sumario: | La detección y reconocimiento de texto sin restricciones es un problema abierto en la investigación. El texto en comics presenta estilos inusuales que plantean muchos desafíos para su detección. Este trabajo apunta a identificar caracteres de texto a nivel de pixel en un género de comics con estilos de texto muy sofisticados: el manga Japonés. Para superar la falta de dataset de manga con anotaciones por carácter, creamos nuestro propio. La mayoría de la literatura en detección de texto utiliza métricas basadas en coordenadas de rectángulos contenedores, los cuales son inadecuados para evaluar a nivel de píxel. Entonces, implementamos métricas especiales para evaluar el desempeño. Usando estos recursos, diseñamos y evaluamos un modelo de redes neuronales profundas, superando métodos actuales de detección de texto en manga en la mayoría de las métricas. |
---|