Detección e identificación de características de vehículos utilizando algoritmos de machine learning

En esta tesis de maestría en ciencias de la ingeniera se propone una implementación modular para resolver el problema del reconocimiento automático de patentes vehiculares (ALPR) basado en un esquema detección-detección-reconocimiento, usando íntegramente deep learning. Se pretende emplear esta i...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Mariotti, Enrique N.
Formato: Tesis NonPeerReviewed
Lenguaje:Español
Publicado: 2020
Materias:
Acceso en línea:http://ricabib.cab.cnea.gov.ar/986/1/Mariotti.pdf
Aporte de:
Descripción
Sumario:En esta tesis de maestría en ciencias de la ingeniera se propone una implementación modular para resolver el problema del reconocimiento automático de patentes vehiculares (ALPR) basado en un esquema detección-detección-reconocimiento, usando íntegramente deep learning. Se pretende emplear esta implementación para aplicaciones practicas que involucran control vehicular visual de cualquier tipo. A lo largo de este trabajo se empleo un enfoque modular, dividiendo el objetivo principal en etapas progresivas. Se desarrollaron módulos individuales, que implementan una arquitectura de clases basada en el paradigma orientado a objetos (OOP), lo que los hace genéricos y fácilmente modificables. A su vez, los módulos u objetos individuales pueden ser usados con otros propósitos, como ser la lectura de texto impreso o señales de transito en imágenes de tracfio urbano. Durante la realización de esta tesis se priorizo el uso de transfer learning en redes profundas convolucionales (CNN), con el objetivo de adaptarse a una disponibilidad de recursos limitada y para disminuir considerablemente los tiempos asociados al entrenamiento. La etapa primaria de segmentación fue basada en un esquema de detección de código libre denominado usualmente YOLOv3, el cual fue re-entrenado con imágenes naturales de vehículos perteneciente a un dataset de acceso publico. La etapa de reconocimiento de texto se lleva a cabo mediante una red recurrente-convolucional (RCNN) que realiza el reconocimiento de la sentencia. Finalmente, el nexo entre estas dos redes esta dado por un esquema detección de uso comercial denominado CRAFT. En este escrito se presentan todos los detalles de la implementación de dicho esquema, y por sobre el final del mismo, se evalúa cuantitativamente la performance del sistema usando diferentes métricas contra OpenALPR, un software de uso extendido en el área de reconocimiento de patentes vehiculares.