Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales.
El monitoreo de cultivo cumple un rol importante en la agricultura. Durante los últimos años se exploró el uso de algoritmos de aprendizaje supervisado (machine learning) en conjunto con imágenes satelitales de los cultivos a monitorear como una herramienta importante en la automatización de este p...
Guardado en:
| Autor principal: | |
|---|---|
| Formato: | Tesis NonPeerReviewed |
| Lenguaje: | Español |
| Publicado: |
2019
|
| Materias: | |
| Acceso en línea: | http://ricabib.cab.cnea.gov.ar/872/1/Aguirre.pdf |
| Aporte de: |
| id |
I25-R131-872 |
|---|---|
| record_format |
dspace |
| institution |
Instituto Balseiro |
| institution_str |
I-25 |
| repository_str |
R-131 |
| collection |
Repositorio Institucional Centro Atómico Bariloche e Instituto Balseiro (RICABIB) |
| language |
Español |
| orig_language_str_mv |
es |
| topic |
Aprendizaje automático [Machine learning Crop classification Clasificación de cultivo Multitemporal classification Clasificación multitemporal Single-date classification Clasificación de una sola fecha Satellite sensing Sensado satelital Sattelite imagery Imágenes satelitales] |
| spellingShingle |
Aprendizaje automático [Machine learning Crop classification Clasificación de cultivo Multitemporal classification Clasificación multitemporal Single-date classification Clasificación de una sola fecha Satellite sensing Sensado satelital Sattelite imagery Imágenes satelitales] Aguirre, Pablo A. Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| topic_facet |
Aprendizaje automático [Machine learning Crop classification Clasificación de cultivo Multitemporal classification Clasificación multitemporal Single-date classification Clasificación de una sola fecha Satellite sensing Sensado satelital Sattelite imagery Imágenes satelitales] |
| description |
El monitoreo de cultivo cumple un rol importante en la agricultura. Durante los últimos años se exploró el uso de algoritmos de aprendizaje supervisado (machine learning) en conjunto con imágenes satelitales de los cultivos a monitorear como una
herramienta importante en la automatización de este proceso, pudiendo monitorear grandes extensiones de cultivo de manera rápida y eficiente.
En este trabajo se estudiaron los principios físicos del sensado remoto (con un enfoque en sensado satelital), los tipos de imágenes que se pueden recolectar de un terreno y las características especificas de cada uno. Se investigo como acceder a dichas imágenes, que son de dominio público. También se estudiaron distintos algoritmos de machine learning y sus bases matemáticas, junto con posibles métricas de rendimiento y sus características. Luego se aplicaron estos algoritmos a la clasificación de cultivos utilizando imágenes ópticas y de radar. Para esto se analizo cual sería la mejor manera de implementar estos algoritmos, utilizando finalmente el lenguaje Python con las implementaciones de los algoritmos encontradas en la librería Scikit-learn.
El objetivo del trabajo fue realizar una comparación del rendimiento de los algoritmos mas utilizados en la clasificación de cultivo bajo distintas condiciones. Los métodos de clasificación principalmente estudiados fueron las técnicas de redes neuronales, maquinas de soporte vectorial, arboles de decisión y bosques aleatorios. Se trabajó buscando la mejor combinación de parámetros de cada clasificador mediante barridos aplicando cross-validation de 5 pliegues. Entre las condiciones estudiadas las más importantes fueron la clasificación considerando y no considerando al tiempo como una variable mas, todo esto utilizando datos de distinta naturaleza (ópticos, radar o ambos).
En la clasificación con datos en los que no se tiene en cuenta la evolución temporal del cultivo el mejor clasificador obtenido utilizando datos ópticos fue una maquina de soporte vectorial con un accuracy del 91% y un kappa de 0.87. El mejor clasificador entrenado con datos de radar también fue una máquina de soporte vectorial con accuracy de 73% y kappa de 0.60.
Respecto a la clasificación con datos en los que se tiene en cuenta la evolución temporal, el mejor clasificador entrenado con imágenes ópticas fue una maquina de soporte vectorial con accuracy de 93% y kappa de 0.91. El mejor clasificador obtenido
utilizando datos de radar fue un bosque aleatorio con kappa 0.86 y un accuracy de 95 %.
Se realizó un análisis del efecto que tiene el tipo de datos utilizado en la clasificación multitemporal de cultivos con periodos de siembra y cosecha similares, llegando a la conclusión de que los datos de radar son más efectivos que los ópticos en estos casos. Sin embargo utilizar la combinación de datos de radar y ópticos fue lo que mejor rendimiento obtuvo.
Por otro lado, se estudió el efecto de entrenar los algoritmos con una base de datos que posee un numero de muestras distinto para cada clase. Esto llevó a la conclusión de que los algoritmos priorizan la correcta clasificación de las clases que presentan mas muestras de entrenamiento. Este estudio indica que es muy importante que los datos de entrenamiento sean una muestra representativa del contexto en el que se van a utilizar los algoritmos. |
| format |
Tesis NonPeerReviewed |
| author |
Aguirre, Pablo A. |
| author_facet |
Aguirre, Pablo A. |
| author_sort |
Aguirre, Pablo A. |
| title |
Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| title_short |
Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| title_full |
Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| title_fullStr |
Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| title_full_unstemmed |
Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| title_sort |
estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. |
| publishDate |
2019 |
| url |
http://ricabib.cab.cnea.gov.ar/872/1/Aguirre.pdf |
| work_keys_str_mv |
AT aguirrepabloa estudiodetecnicasdemachinelearningaplicadasalaclasificaciondecultivoenimagenessatelitales |
| _version_ |
1812569704298971136 |
| spelling |
I25-R131-8722021-03-12T11:18:59Z Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. Study of machine learning techniques applied to crop classification on satelite imagery. Aguirre, Pablo A. Aprendizaje automático [Machine learning Crop classification Clasificación de cultivo Multitemporal classification Clasificación multitemporal Single-date classification Clasificación de una sola fecha Satellite sensing Sensado satelital Sattelite imagery Imágenes satelitales] El monitoreo de cultivo cumple un rol importante en la agricultura. Durante los últimos años se exploró el uso de algoritmos de aprendizaje supervisado (machine learning) en conjunto con imágenes satelitales de los cultivos a monitorear como una herramienta importante en la automatización de este proceso, pudiendo monitorear grandes extensiones de cultivo de manera rápida y eficiente. En este trabajo se estudiaron los principios físicos del sensado remoto (con un enfoque en sensado satelital), los tipos de imágenes que se pueden recolectar de un terreno y las características especificas de cada uno. Se investigo como acceder a dichas imágenes, que son de dominio público. También se estudiaron distintos algoritmos de machine learning y sus bases matemáticas, junto con posibles métricas de rendimiento y sus características. Luego se aplicaron estos algoritmos a la clasificación de cultivos utilizando imágenes ópticas y de radar. Para esto se analizo cual sería la mejor manera de implementar estos algoritmos, utilizando finalmente el lenguaje Python con las implementaciones de los algoritmos encontradas en la librería Scikit-learn. El objetivo del trabajo fue realizar una comparación del rendimiento de los algoritmos mas utilizados en la clasificación de cultivo bajo distintas condiciones. Los métodos de clasificación principalmente estudiados fueron las técnicas de redes neuronales, maquinas de soporte vectorial, arboles de decisión y bosques aleatorios. Se trabajó buscando la mejor combinación de parámetros de cada clasificador mediante barridos aplicando cross-validation de 5 pliegues. Entre las condiciones estudiadas las más importantes fueron la clasificación considerando y no considerando al tiempo como una variable mas, todo esto utilizando datos de distinta naturaleza (ópticos, radar o ambos). En la clasificación con datos en los que no se tiene en cuenta la evolución temporal del cultivo el mejor clasificador obtenido utilizando datos ópticos fue una maquina de soporte vectorial con un accuracy del 91% y un kappa de 0.87. El mejor clasificador entrenado con datos de radar también fue una máquina de soporte vectorial con accuracy de 73% y kappa de 0.60. Respecto a la clasificación con datos en los que se tiene en cuenta la evolución temporal, el mejor clasificador entrenado con imágenes ópticas fue una maquina de soporte vectorial con accuracy de 93% y kappa de 0.91. El mejor clasificador obtenido utilizando datos de radar fue un bosque aleatorio con kappa 0.86 y un accuracy de 95 %. Se realizó un análisis del efecto que tiene el tipo de datos utilizado en la clasificación multitemporal de cultivos con periodos de siembra y cosecha similares, llegando a la conclusión de que los datos de radar son más efectivos que los ópticos en estos casos. Sin embargo utilizar la combinación de datos de radar y ópticos fue lo que mejor rendimiento obtuvo. Por otro lado, se estudió el efecto de entrenar los algoritmos con una base de datos que posee un numero de muestras distinto para cada clase. Esto llevó a la conclusión de que los algoritmos priorizan la correcta clasificación de las clases que presentan mas muestras de entrenamiento. Este estudio indica que es muy importante que los datos de entrenamiento sean una muestra representativa del contexto en el que se van a utilizar los algoritmos. Crop monitoring has an important role in agriculture. During the last years the use of machine learning algorithms with satellite imagery altogether was explored as an important tool in automation of this process because of its ability to monitor big extensions of eld in a fast and efficient way. In this work the physical principles of remote sensing were studied (with focus on satellite sensing) along with the possible types of imagery you can gather from agricultural terrain and specic characteristics of every one of this types. How to acquire this public domain images was investigated. Different machine learning algorithms were also studied along with their mathematical basis and possible performance metrics. Then this algorithms were applied to crop classication using optical and radar imagery. For this purpose the best way to implement said algorithms was analyzed. Finally coding language Python with the algorithms implementations found in Scikit-learn library were used. The objective of this work was to make a comparation of the most used algorithms performances on crop classication under different conditions. The mainly studied methods were support vector machines, neural networks, decision trees and random forests. Research was made looking for the best combination of parameters for each classier using 5-fold cross-validation. The most important conditions studied were multitemporal and single date classication, using data of different nature (optical, radar or both). On single-date classication, the best classier obtained using optical data was a support vector machine with accuracy of 91% and a kappa coefficient of 0.87. The best classier trained with radar data was also a support vector machine with obtained accuracy of 73% and a 0.60 kappa coefficient. Regarding multitemporal classication, the best classier trained with optical data was a support vector machine with obtained accuracy of 93% and a 0.91 kappa coefficient. The best classier obtained using radar data was a random forest with obtained kappa of 0.86 and accuracy of 95%. An analysis of the effect of the type of data used on multitemporal classication of crops with similar planting and harvest periods was made. This study led to the conclusion that radar data is more effective than optical in this cases. However, using a combination of both radar and optical data gave the best results. On other side, the effect of trainning algorithms with a database that has a different number of samples for every class was studied. This led to the conclusion that the algorithms priorize the correct classication of the classes that have the most trainning samples. This study indicate that it is very important that the trainning data consist in a representative sample of the context the algorithms are going to be utilized. 2019-12-17 Tesis NonPeerReviewed application/pdf http://ricabib.cab.cnea.gov.ar/872/1/Aguirre.pdf es Aguirre, Pablo A. (2019) Estudio de técnicas de machine learning aplicadas a la clasificación de cultivo en imágenes satelitales. / Study of machine learning techniques applied to crop classification on satelite imagery. Proyecto Integrador Ingeniería en Telecomunicaciones, Universidad Nacional de Cuyo, Instituto Balseiro. http://ricabib.cab.cnea.gov.ar/872/ |