Object detection and segmentation in aerial images is currently a vibrant and significant field of research. The iSAID dataset has been created for object detection in images captured by aerial vehicles. In this study, image semantic segmentation was performed on the iSAID dataset using Generative Adversarial Networks (GANs). The compared GAN methods are CycleGAN, DCLGAN, SimDCL, and SSimDCL. All methods operate on unpaired images. DCLGAN and SimDCL methods are derived by taking inspiration from the CycleGAN method. In these methods, cost functions and network structures vary. This study thoroughly examines the methods, and their similarities and differences are observed. After semantic segmentation is performed, the results are presented using both visual and measurement metrics. Measurement metrics such as FID, KID, PSNR, FSIM, SSIM, and MAE are used. Experimental studies show that SSimDCL and SimDCL methods outperform other methods in iSAID image semantic segmentation. CycleGAN method, on the other hand, is observed to be less successful compared to other methods. The aim of this study is to perform automatic semantic segmentation in aerial images.
Hava görüntülerinde nesne tespiti ve segmentasyonu şu anda canlı ve önemli bir araştırma alanıdır. iSAID veri seti, hava araçlarıyla çekilen görüntülerde nesne tespiti amacıyla oluşturulmuştur. Bu çalışmada, Generative Adversarial Networks (GAN'ler) kullanılarak iSAID veri seti üzerinde görüntü semantik bölütleme yapılmıştır. Karşılaştırılan GAN yöntemleri CycleGAN, DCLGAN, SimDCL ve SSimDCL'dir. Tüm yöntemler eşleştirilmemiş görüntüler üzerinde çalışır. DCLGAN ve SimDCL yöntemleri CycleGAN yönteminden ilham alınarak türetilmiştir. Bu yöntemlerde maliyet fonksiyonları ve ağ yapıları farklılık göstermektedir. Bu çalışmada yöntemler ayrıntılı olarak incelenmekte, benzerlikleri ve farklılıkları gözlemlenmektedir. Semantik segmentasyon yapıldıktan sonra sonuçlar hem görsel hem de nicel metrikler kullanılarak sunulmuştur. Bu çalışmada; FID, KID, PSNR, FSIM, SSIM ve MAE gibi ölçüm metrikleri kullanılmıştır. Deneysel çalışmalar, SSimDCL ve SimDCL yöntemlerinin iSAID görüntü semantik segmentasyonunda diğer yöntemlerden daha iyi performans ile sonuçlandığını göstermektedir. CycleGAN yönteminin ise diğer yöntemlere göre daha az başarılı olduğu görülmektedir. Bu çalışmanın amacı hava görüntülerinde otomatik semantik bölütleme gerçekleştirmektir.
Birincil Dil | İngilizce |
---|---|
Konular | Görüntü İşleme, Derin Öğrenme, Nöral Ağlar |
Bölüm | Makaleler |
Yazarlar | |
Erken Görünüm Tarihi | 29 Mart 2024 |
Yayımlanma Tarihi | 29 Mart 2024 |
Gönderilme Tarihi | 5 Kasım 2023 |
Kabul Tarihi | 11 Şubat 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 15 Sayı: 1 |