Artan nüfus yoğunluğunun ve küresel ısınmadan kaynaklanan iklim değişikliklerinin tarımsal üretimin miktarı ve kalitesi üzerinde önemli etkileri bulunmaktadır. Bu nedenle dünya, gıda kıtlığı gibi ciddi problemlerle karşı karşıyadır. Dolayısıyla tarım, ülkelerin ekonomik ve sosyal kalkınma programlarında bulunan hayati bir faaliyettir. Sert kabuklu meyveler kategorisinde dünyada bademden sonra üretimi en fazla yapılan ürün fındıktır. Üretimi Türkiye, İtalya, İspanya, ABD gibi ülkelerde yoğunlaşmış olan fındığın dünyadaki talebinin yaklaşık %70'ini Türkiye karşılamaktadır. Bu nedenle, fındık üretiminde verime etki eden parametrelerin tespit edilmesi ve bu parametrelere bağlı olarak verimin tahmin edilmesi çok büyük önem arz etmektedir. Bu çalışmada, Sakarya, Düzce, Samsun, Giresun, Trabzon illerindeki ve bu illerin fındık üretimi yapılan ilçelerindeki, fındık üretimine etki eden parametreler incelenerek bir sonraki adımda elde edilecek verim tahmini yapılmıştır. Tahmin işlemi için gereken özniteliklerin eldesi için ham veri setine bazı ön işleme adımları uygulanmış, temel bileşenler analizi (Principal Component Analysis, PCA) ile öznitelik sayısı azaltılmıştır. Ön işlemeden geçen bu veriler girdi olarak, XGBoost algoritması, Yalın Uzun-Kısa Süreli Bellek (Long Short-Term Memory, LSTM) modeli, Yığılmış LSTM modeli, Konvolüsyonel Sinir Ağı (Convolutional Neural Network, CNN) modeli ve CNN-LSTM hibrit modeline verilerek tahmin işlemi gerçekleştirilmiştir. Son olarak bu yöntemlerin her biri için Ortalama Hataların Karekökü (Root Mean Square Error, RMSE) ile tahmin hatası elde edilmiş ve yöntem kıyaslamaları için kullanılmıştır. Bu sonuçlara göre, en düşük RMSE=1,32 değeriyle en iyi performans CNN-LSTM hibrit modeli ile elde edilmiştir.
Fındık verim tahmini CNN LSTM XGBoost algoritması Temel bileşenler analizi
Increasing population density and climate changes resulting from global warming have significant effects on the amount and quality of agricultural production. Therefore, the world is facing severe problems, such as food shortages. Therefore, agriculture is a vital activity in countries' economic and social development programs. In the category of hard-shelled fruits, hazelnut is the most produced product in the world after almonds. Turkey meets approximately 70% of the world's demand for hazelnut, which is concentrated in countries such as Turkey, Italy, Spain, and the USA. For this reason, it is essential to determine the parameters affecting the yield in hazelnut production and to estimate the yield depending on these parameters. In this study, the parameters affecting the hazelnut production in the provinces of Sakarya, Düzce, Samsun, Giresun, Trabzon and the districts of these provinces where hazelnut production is made were examined, and the yield estimation to be obtained in the next step was made. In order to get the features required for the forecasting process, some pre-processing steps were applied to the raw data set, and the number of features was reduced by Principal Components Analysis (PCA). These pre-processed data were given as input to the XGBoost algorithm, Lean (Long Short-Term Memory, LSTM) model, Stacked LSTM model, (Convolutional Neural Network, CNN) model and CNN-LSTM hybrid model, and estimation was carried out. Finally, (Root Mean Square Error, RMSE) estimation error was obtained for each method and used for comparison. According to these results, the best performance with the lowest RMSE=1.32 value was obtained with the CNN-LSTM hybrid model.
Hazelnut yield forecasting CNN LSTM XGBoost algorithm Principal component analysis
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Research Articles |
Yazarlar | |
Yayımlanma Tarihi | 1 Nisan 2023 |
Gönderilme Tarihi | 27 Şubat 2023 |
Kabul Tarihi | 29 Mart 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 6 Sayı: 2 |