Derin öğrenme yaklaşımlarının performansı, eğitim aşamasında
kullanılan veri kümesinin büyüklüğü ile doğru orantılıdır. Bu nedenle günümüzde
imge sınıflandırma, bölütleme veya nesne yakalama gibi problemlerin çözümü için
büyük veri kümeleri inşa edilmektedir. Örneğin Alexnet veritabanı 1.2M imge ve
1K kategoriye; Imagenet, 15M imge ve 22K kategoriye; Yahoo Flickr, 100M imge ve
2K kategoriye sahiptir. Bu veri kümeleriyle eğitilen derin ağların doğruluk
oranı oldukça yüksektir. Ancak imgeleri kategorilere atama işleminin manuel
yapılması, hiç şüphesiz derin öğrenme yaklaşımlarının en büyük dezavantajıdır.
İmgeleri kategorize etme (etiketleme), oldukça zahmetli ve hata eğilimi yüksek
bir işlemdir. Bu zorluğu ve hata ihtimalini kaldırılabilmek için gerçek imgeler
yerine, sentetik imgeleri içeren veri kümelerinin kullanımı önerilmektedir.
Sentetik imge üretimi, şekil ve desen üretimi aşamalarını içermektedir. Bir
nesnenin sentetik olarak üretilebilmesi şekil ve desen tanımlayıcı modellerin
inşasıyla mümkündür.
Bu çalışma, desen tanımlayıcı yöntemleri (Parça, Piksel, Piramit)
kapsamaktadır. Bu yöntemler, gerçek bir imgeden alınan küçük bir desen
bilgisinden yola çıkarak deseni yayma ve yüksek boyutlu imge üretmeyi
amaçlamaktadır. Doğruluk, zaman ve gürültü duyarlılığı kıstaslarıyla yapılan
kıyaslama sonucunda parça tabanlı yöntemin en elverişli desen yayma yöntemi
olduğu kanaatine varılmıştır.
The performance of deep learning approaches is directly
proportional to the size of the data set used in the training phase. For this
reason, large data sets are currently being built to solve problems such as
image classification, segmentation or object capture. For example Alexnet
database 1.2M image and 1K categorie; Imagenet, 15M image and 22K categorie;
Yahoo Flickr has 100M image and 2K categorization. However, manual assignment
of imagery to categories is undoubtedly the greatest disadvantage of deep
learning approaches. Categorizing images (labeling) is a very troublesome and
error-prone process. In order to remove the possibility of this difficulty and
error, it is suggested to use data sets containing synthetic images instead of
real images. Synthetic image production includes phases of pattern and pattern
production. It is possible to synthetically produce an object by constructing
shape and pattern descriptive models.
This study covers pattern descriptive methods (Patch, Pixel,
Pyramid). These methods are aimed at generating a high-dimensional image by
spreading the pattern out of a small pattern information obtained from a real
image. As a result of comparison with accuracy, time and noise sensitivity
criteria, the pach-based method is considered to be the most suitable pattern
spreading method.
Birincil Dil | Türkçe |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | PAPERS |
Yazarlar | |
Yayımlanma Tarihi | 15 Eylül 2018 |
Gönderilme Tarihi | 7 Nisan 2018 |
Kabul Tarihi | 26 Eylül 2018 |
Yayımlandığı Sayı | Yıl 2018 Cilt: 3 Sayı: 2 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.