Identificación y Conteo de Viviendas en Zonas Periurbanas, por medio de Imágenes Satelitales Ópticas aplicando técnicas de Clasificación de Machine Learning

"En la actualidad, la identificación y conteo de viviendas, se realiza mediante censos nacionales o regionales. Estos censos, generalmente son llevados a cabo cada diez años, esta situación impide la disponibilidad de datos actualizados en el ámbito del área de Cartografía del Instituto Provinc...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Lezana, Claudio
Formato: Tesis de maestría
Lenguaje:Español
Publicado: 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5063
Aporte de:
Descripción
Sumario:"En la actualidad, la identificación y conteo de viviendas, se realiza mediante censos nacionales o regionales. Estos censos, generalmente son llevados a cabo cada diez años, esta situación impide la disponibilidad de datos actualizados en el ámbito del área de Cartografía del Instituto Provincial de Estadística y Ciencia de Datos (IPECD) y por consiguiente afecta la capacidad de responder eficientemente a las demandas de la sociedad u organismos gubernamentales. Estas demandas abarcan todos los productos ofrecidos por la IPECD, como el Índice de Precios al Consumidor (IPC) y la Encuesta Permanente de Hogares (EPH); entre otros, pero desde la perspectiva de la Geo-estadística, es decir, centrándose en el análisis y la modelización de variables asociadas a la información espacial. En busca de soluciones innovadoras, aprovechamos los avances en tecnologías de la información, hardware y software, como así también el auge de la Inteligencia Artificial (IA) y, específicamente, los algoritmos de aprendizaje automático o machine learning, sean supervisados o no supervisados, que ofrecen herramientas poderosas para identificar patrones en imágenes multi-espectrales y clasificar objetos geográficos de interés. En el presente trabajo se aplicaron diversos algoritmos y técnicas de machine learning cuyo objetivo fue desarrollar una herramienta de apoyo que permita la identificación y conteo de viviendas en imágenes satelitales ópticas de zonas periurbanas del Área Metropolitana del Gran Resistencia (AMGR), en la provincia del Chaco, Argentina. Definiendo como la unidad de análisis al radio censal, establecido por el Instituto Nacional de Estadística y Censos (INDEC). En el desarrollo de la investigación se llevaron a cabo varios experimentos: utilizando tres enfoques principales: En primer lugar el modelo de Umbralización, método básico de segmentación que permite distinguir objetos en una imagen mediante la aplicación de un umbral de intensidad. En segundo lugar el modelo K-Nearest Neighbors (KNN), un algoritmo de clasificación supervisada que asigna una clase a una muestra basándose en la clase más común entre sus k vecinos más cercanos. Para finalizar el modelo U-Net, arquitectura de red neuronal convolucional (CNN) diseñada para tareas de segmentación de imágenes, que permite una clasificación precisa a nivel de píxel. Estos métodos fueron evaluados y comparados utilizando métricas de desempeño estándar, como precisión, recall, F1-Score y accuracy, para determinar el más adecuado. Los resultados indicaron que U-Net es el modelo más robusto y equilibrado, con un F1-Score de 88.4%, destacándose en la identificación de viviendas. El modelo seleccionado fue posteriormente integrado con una base de datos geoespacial para su validación. En conclusión, la aplicación de modelos de machine learning para la detección de viviendas en imágenes satelitales ópticas ha demostrado ser una herramienta poderosa y eficiente, más específicamente el modelo U-Net que para nuestro caso de uso ha mostrado una precisión aceptable, mejorando el proceso de actualización y procesamiento cartográfico en el IPECD. Aunque se encontraron desafíos, como la selección de una resolución espacial adecuada, la investigación proporcionó un conocimiento valioso sobre los modelos de machine learning y los requisitos de hardware necesarios."