Ocena dokładności modeli wzrostu pszenicy ozimej na podstawie danych teledetekcyjnych

Autor
Gurdak, Radosław
Promotor
Dąbrowska-Zielińska, Katarzyna
Bojanowski, Jędrzej Stanisław
Data publikacji
2024-11-07
Abstrakt (PL)

Celem niniejszej rozprawy doktorskiej była ocena dokładności istniejących produktów LAI (Copernicus Land Monitoring Service, oprogramowanie SNAP) i modelowanych z danych satelitarnych (Sentinel-2, Landsat-8, Proba-V/Sentinel-3) oraz ocena ich wpływu na dokładność prognozowania plonów pszenicy ozimej. W pracy zastosowano metody modelowania plonów przy użyciu zarówno metod uczenia maszynowego (regresja wektorów nośnych - SVR i las losowy - RF), jak i modelu wzrostu roślin AquaCrop. Zakres pracy obejmował zgromadzenie danych z satelitów Sentinel-2, Landsat 8 oraz Proba-V/Sentinel-3. Dane te pokrywają powierzchnię badawczą JECAM-Wielkopolska (dla lat 2016-2021) oraz, do procesu walidacji modeli, obszar całej Polski dla roku 2021. Elementem pracy było również opracowanie metodologii i wykonanie badań terenowych w celu zebrania danych in situ o wskaźnikach wzrostu roślin oraz plonowaniu. Wykonana ocena dokładności szacowania wartości LAI z różnych zbiorów danych w stosunku do wartości LAI pomierzonych naziemnie udowodniła, że najmniejszymi błędami cechuje się zbiór utworzony na podstawie wskaźnika NDVI z satelity Sentinel-2. Otrzymane wyniki potwierdzają, że niepewność związana z parametrami biofizycznymi pochodzącymi z danych satelitarnych znacząco wpływa na dokładność prognoz plonów pszenicy ozimej. Najwyższe dokładności modeli szacowania plonu dla pól uprawnych na obszarze JECAM uzyskano przy zastosowaniu LAI modelowanego z NDVI obliczonego z Sentinel-2, w połączeniu z wartościami opadów z reanalizy klimatologicznej ERA5 (R2=0,75; MAE=6,78 dt/ha; RMSE=8,04 dt/ha). Walidacja modelu na terenie całego kraju wykazała gorsze dopasowanie modelu niż dla pól JECAM (R2=0,43), ale mniejsze wartości błędów (MAE=4,64 dt/ha; RMSE=5,36 dt/ha). Dla pól i województw, zastosowanie algorytmu RF prowadziło do uzyskiwania dokładniejszych wyników predykcji plonów niż za pomocą modelu SVR. W pracy opracowano również metodę zastosowania modelu wzrostu upraw AquaCrop wraz z asymilacją danych satelitarnych. Model może być skutecznie wykorzystany do szacowania plonów pszenicy ozimej w skali regionalnej (R2=0,47; MAE=6,27 dt/ha; RMSE=8,86 dt/ha), jednak ze względu na wymaganą dużą liczbę danych wejściowych i ich złożoną charakterystykę zauważono trudności w implementacji metody dla terenu całego kraju.

Abstrakt (EN)

The aim of the study was to assess the accuracy of LAI products from the Copernicus Land Monitoring Service and SNAP software, as well as those modeled from satellite data (Sentinel-2, Landsat-8, and Proba-V/Sentinel-3), and to evaluate their impact on the accuracy of winter wheat yield forecasting. The study applied yield modeling methods using both machine learning methods (Support Vector Regression and Random Forest) and AquaCrop crop growth model. The scope of this thesis included the collection of data from Sentinel-2, Landsat 8 and Proba-V/Sentinel-3 in 2016-2021. These data cover the JECAM-Wielkopolska study area and for the model validation process, the area of Poland. This thesis also involved developing a methodology and conducting field surveys to collect in-situ data on vegetation indices and crop yields. The performed assessment of the accuracy of estimating LAI values from different data sets in relation to in-situ LAI values proved that the set formed on the basis of NDVI from Sentinel-2 is characterized by the smallest errors. The results obtained confirm that the uncertainty associated with biophysical parameters derived from satellite data, particularly those related to vegetation indices or LAI, significantly affects the accuracy of winter wheat yield forecasts. The highest accuracies of yield estimation models for crop fields in the JECAM area were obtained using LAI modeled from NDVI calculated from Sentinel-2 imagery, combined with precipitation values from ERA5 climatological reanalysis (R2=0.75; MAE=6.78 dt/ha; RMSE=8.04 dt/ha). Model validation across the country showed worse model fit than for the JECAM fields (R2=0.43) but smaller error values (MAE=4.64 dt/ha; RMSE=5.36 dt/ha). In summary, for fields and provinces, the use of the Random Forest algorithm led to more accurate yield prediction results than with the Support Vector Regression model. In addition, a method for applying the AquaCrop crop growth model with satellite data assimilation was also developed. The model can be effectively used to estimate winter wheat yields on a regional scale (R2=0.47; MAE=6.27 dt/ha; RMSE=8.86 dt/ha), but due to the required number of input parameters and their complex characteristics, difficulties were noted in implementing the method for the entire country.

Słowa kluczowe PL
pszenica ozima
prognozowanie plonu
uczenie maszynowe
AquaCrop
dane teledetekcyjne
Inny tytuł
Assessment of the accuracy of winter wheat yield models based on remote sensing data
Data obrony
2024-11-26
Licencja otwartego dostępu
Dostęp zamknięty