Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto

La detección de bosques en datos de sensado remoto es esencial para aplicaciones importantes tales como la detección de áreas con desertificación, simulación de inundaciones, análisis de la salud de bosques, conversión de modelos digitales de elevación, entre otras. Sin embargo, dicha tarea comprend...

Descripción completa

Detalles Bibliográficos
Autor principal: Caffaratti, Gabriel Dario
Formato: Artículo revista
Lenguaje:Español
Publicado: Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas 2023
Materias:
Acceso en línea:Caffaratti, G. D. (2023). Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto [Tesis de doctorado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina.
Aporte de:
id I21-R190-123456789-3628
record_format ojs
institution Universidad Nacional del Centro
institution_str I-21
repository_str R-190
container_title_str Repositorio Institucional de Acceso Abierto (RIDAA)
language Español
format Artículo revista
topic Tesis de doctorado
Bosques
Sensado remoto
Machine learning
Ciencias de la computación
Teledetección
spellingShingle Tesis de doctorado
Bosques
Sensado remoto
Machine learning
Ciencias de la computación
Teledetección
Caffaratti, Gabriel Dario
Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
topic_facet Tesis de doctorado
Bosques
Sensado remoto
Machine learning
Ciencias de la computación
Teledetección
author Caffaratti, Gabriel Dario
author_facet Caffaratti, Gabriel Dario
author_sort Caffaratti, Gabriel Dario
title Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
title_short Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
title_full Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
title_fullStr Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
title_full_unstemmed Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
title_sort detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto
description La detección de bosques en datos de sensado remoto es esencial para aplicaciones importantes tales como la detección de áreas con desertificación, simulación de inundaciones, análisis de la salud de bosques, conversión de modelos digitales de elevación, entre otras. Sin embargo, dicha tarea comprende diversas alternativas en cuanto al origen de los datos remotos, el tipo de señal utilizada, la resolución con la que se trabaja, la cobertura que se pretende, o la dinámica temporal del conjunto de datos. Por otra parte, las soluciones pueden presentar distintas estrategias de caracterización de los datos, utilizar diferentes algoritmos de clasificación o regresión, involucrar tipos de clasificadores diversos en cuanto a su salida, o incluso estar dirigidas a diferentes áreas de aplicación relacionadas con la problemática de la detección de bosques pero ser muy diferentes entre sí. En la presente tesis se observó que las técnicas existentes exhiben inconvenientes. Uno de los problemas observados es la dificultad para generalizar correctamente en diferentes escenarios, ya que estos cambian de acuerdo a los distintos biomas, como así también ante las distintas estaciones del año. Por otra parte, presentan problemas de calidad en sus resultados finales, derivando en zonas de bosques incorrectamente demarcadas, omitidas o erróneamente clasificadas. Requieren de la intervención humana para la caracterización de los datos de entrada, haciendo que la selección de reglas de caracterización, análisis estadístico, o cualquiera de los procesos llevados a cabo para su realización, sean costosos y demanden mucho tiempo, a la vez que sean poco generalizables o propensos a errores. Por otro lado, en algunos casos utilizan software propietario basado en reglas manuales, los cuales carecen de información desus procesos internos, lo que dificulta su reproducción en experimentos y perfeccionamiento.A su vez, si bien existe una enorme cantidad de datos disponibles de una gran diversidadde fuentes, la existencia de etiquetas es escasa o nula, lo que dificulta el entrenamiento de modelos de machine learning, en especial aquellos que requieren gran cantidad de ejemplos. Los problemas mencionados anteriormente son abordados en esta tesis por medio de diversas contribuciones. Primero, se propuso una metodología para la creación de data sets de distintas fuentes de sensado remoto, con la cual se confeccionó uno a partir de los datos de la misión SRTM y Landsat-8. Para el etiquetado de estos datos, se utilizó la máscara de Bosque/No-Bosque desarrollada por la Agencia Espacial Japonesa JAXA como referen-cia, la cual representa el estado del arte actual. Esto permitió obtener grandes cantidades de datos etiquetados con los cuales fue posible entrenar modelos por medio de aprendizaje supervisado, y a su vez evaluar la factibilidad del proyecto. Segundo, se construyó un fra-mework compuesto de distintos módulos encargados de tareas específicas en el proceso de generación de una máscara de Bosque/No-Bosque para una zona determinada. Este frame-work permite experimentar con diversas estrategias de caracterización, aumento de datos y clasificación. Con el mismo, se propuso algunas configuraciones que fueron sujetas a un amplio proceso de optimización y a diversas evaluaciones, pero a su vez facilita estudiar muchas otras configuraciones no exploradas hasta el momento. Tercero, se presentaron dos estrategias de caracterización automáticas desarrolladas para el problema de la detección de bosques, que permiten la utilización de ventanas de píxeles que proporcionan información contextual a los píxeles a clasificar a algoritmos de machine learning convencionales que solo aceptan información vectorial como entrada. De tal forma, se pudo comparar de forma justa algoritmos de clasificación ampliamente adoptados en la bibliografía con algoritmos de clasi-ficación modernos como las redes convolucionales, que caracterizan automáticamente datosmultidimensionales. Finalmente, se incorporó un módulo de aumento de datos, ausente en todos los trabajos estudiados en la bibliografía, que proporciona un aumento de la capacidad de generalización de los modelos, y que participa en el éxito del modelo que logra superartodas las pruebas a las que es sometido.En cuanto a las configuraciones generadas en el marco del framework creado, se desarrollaron varios modelos de clasificación utilizando una variedad de técnicas de machinelearning, a saber, Redes Neuronales Convolucionales (CNN, convolutional neural networks), anidamiento de Bosques Aleatorios (RF, random forest), y Máquinas de Vectores de Soporte(SVM, support vector machines). Diferentes arquitecturas de CNN fueron creadas específicamente para el problema de detección de bosque, y arquitecturas de RF y SVM con soporte de estrategias de caracterización alternativas para esta tarea. Posterior a la optimización de hiperparámetros y entrenamiento de estos modelos con el conjunto de entrenamiento generado, la efectividad de los mismos fue evaluada usando la máscara Bosque/No-Bosquede JAXA comoground truth, en distintas zonas correspondientes a diversos países de Latinoamérica, involucrando diferentes desafíos a resolver. Adicionalmente, estos modelos fueroncomparados contra la máscara de JAXA en sí, utilizando comoground truthuna máscaraetiquetada manualmente y validada por expertos del dominio. Los experimentos mostraron resultados prometedores en términos de diversas métricas y de generalización, mientras que automatizaron tareas de caracterización que requerían la intervención humana en las fases de entrenamiento y clasificación.
publisher Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas
publishDate 2023
url Caffaratti, G. D. (2023). Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto [Tesis de doctorado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina.
work_keys_str_mv AT caffarattigabrieldario detecciondebosquesmedianteelusodemachinelearningapartirdedispositivosdesensadoremoto
first_indexed 2024-08-12T22:53:04Z
last_indexed 2024-08-12T22:53:04Z
_version_ 1807224075217534976
spelling I21-R190-123456789-36282023-11-24T14:20:30Z Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto Caffaratti, Gabriel Dario Marchetta, Martín Tesis de doctorado Bosques Sensado remoto Machine learning Ciencias de la computación Teledetección La detección de bosques en datos de sensado remoto es esencial para aplicaciones importantes tales como la detección de áreas con desertificación, simulación de inundaciones, análisis de la salud de bosques, conversión de modelos digitales de elevación, entre otras. Sin embargo, dicha tarea comprende diversas alternativas en cuanto al origen de los datos remotos, el tipo de señal utilizada, la resolución con la que se trabaja, la cobertura que se pretende, o la dinámica temporal del conjunto de datos. Por otra parte, las soluciones pueden presentar distintas estrategias de caracterización de los datos, utilizar diferentes algoritmos de clasificación o regresión, involucrar tipos de clasificadores diversos en cuanto a su salida, o incluso estar dirigidas a diferentes áreas de aplicación relacionadas con la problemática de la detección de bosques pero ser muy diferentes entre sí. En la presente tesis se observó que las técnicas existentes exhiben inconvenientes. Uno de los problemas observados es la dificultad para generalizar correctamente en diferentes escenarios, ya que estos cambian de acuerdo a los distintos biomas, como así también ante las distintas estaciones del año. Por otra parte, presentan problemas de calidad en sus resultados finales, derivando en zonas de bosques incorrectamente demarcadas, omitidas o erróneamente clasificadas. Requieren de la intervención humana para la caracterización de los datos de entrada, haciendo que la selección de reglas de caracterización, análisis estadístico, o cualquiera de los procesos llevados a cabo para su realización, sean costosos y demanden mucho tiempo, a la vez que sean poco generalizables o propensos a errores. Por otro lado, en algunos casos utilizan software propietario basado en reglas manuales, los cuales carecen de información desus procesos internos, lo que dificulta su reproducción en experimentos y perfeccionamiento.A su vez, si bien existe una enorme cantidad de datos disponibles de una gran diversidadde fuentes, la existencia de etiquetas es escasa o nula, lo que dificulta el entrenamiento de modelos de machine learning, en especial aquellos que requieren gran cantidad de ejemplos. Los problemas mencionados anteriormente son abordados en esta tesis por medio de diversas contribuciones. Primero, se propuso una metodología para la creación de data sets de distintas fuentes de sensado remoto, con la cual se confeccionó uno a partir de los datos de la misión SRTM y Landsat-8. Para el etiquetado de estos datos, se utilizó la máscara de Bosque/No-Bosque desarrollada por la Agencia Espacial Japonesa JAXA como referen-cia, la cual representa el estado del arte actual. Esto permitió obtener grandes cantidades de datos etiquetados con los cuales fue posible entrenar modelos por medio de aprendizaje supervisado, y a su vez evaluar la factibilidad del proyecto. Segundo, se construyó un fra-mework compuesto de distintos módulos encargados de tareas específicas en el proceso de generación de una máscara de Bosque/No-Bosque para una zona determinada. Este frame-work permite experimentar con diversas estrategias de caracterización, aumento de datos y clasificación. Con el mismo, se propuso algunas configuraciones que fueron sujetas a un amplio proceso de optimización y a diversas evaluaciones, pero a su vez facilita estudiar muchas otras configuraciones no exploradas hasta el momento. Tercero, se presentaron dos estrategias de caracterización automáticas desarrolladas para el problema de la detección de bosques, que permiten la utilización de ventanas de píxeles que proporcionan información contextual a los píxeles a clasificar a algoritmos de machine learning convencionales que solo aceptan información vectorial como entrada. De tal forma, se pudo comparar de forma justa algoritmos de clasificación ampliamente adoptados en la bibliografía con algoritmos de clasi-ficación modernos como las redes convolucionales, que caracterizan automáticamente datosmultidimensionales. Finalmente, se incorporó un módulo de aumento de datos, ausente en todos los trabajos estudiados en la bibliografía, que proporciona un aumento de la capacidad de generalización de los modelos, y que participa en el éxito del modelo que logra superartodas las pruebas a las que es sometido.En cuanto a las configuraciones generadas en el marco del framework creado, se desarrollaron varios modelos de clasificación utilizando una variedad de técnicas de machinelearning, a saber, Redes Neuronales Convolucionales (CNN, convolutional neural networks), anidamiento de Bosques Aleatorios (RF, random forest), y Máquinas de Vectores de Soporte(SVM, support vector machines). Diferentes arquitecturas de CNN fueron creadas específicamente para el problema de detección de bosque, y arquitecturas de RF y SVM con soporte de estrategias de caracterización alternativas para esta tarea. Posterior a la optimización de hiperparámetros y entrenamiento de estos modelos con el conjunto de entrenamiento generado, la efectividad de los mismos fue evaluada usando la máscara Bosque/No-Bosquede JAXA comoground truth, en distintas zonas correspondientes a diversos países de Latinoamérica, involucrando diferentes desafíos a resolver. Adicionalmente, estos modelos fueroncomparados contra la máscara de JAXA en sí, utilizando comoground truthuna máscaraetiquetada manualmente y validada por expertos del dominio. Los experimentos mostraron resultados prometedores en términos de diversas métricas y de generalización, mientras que automatizaron tareas de caracterización que requerían la intervención humana en las fases de entrenamiento y clasificación. Fil: Caffaratti, Gabriel Dario. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. Fil: Marchetta, Martín. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas; Argentina. 2023-02 2023-11-07T13:11:47Z 2023-11-07T13:11:47Z info:ar-repo/semantics/tesis doctoral info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/acceptedVersion Caffaratti, G. D. (2023). Detección de bosques mediante el uso de machine learning a partir de dispositivos de sensado remoto [Tesis de doctorado]. Universidad Nacional del Centro de la Provincia de Buenos Aires, Argentina. https://doi.org/10.52278/3628 https://www.ridaa.unicen.edu.ar/handle/123456789/3628 spa http://creativecommons.org/licenses/by-nc/2.5/ar/ info:eu-repo/semantics/openAccess application/pdf application/pdf Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ciencias Exactas