Bulanık c-ortalama kümeleme, literatürde farklı alanlarda kullanılan yaygın kümeleme algoritmalarından biridir. Boyut küçültme, büyük veri kümelerini, en az bilgi kaybıyla eşdeğeri olan daha küçük boyutlu veri kümelerine dönüştüren bir tekniktir. Bu makalede, boyut azalmasının farklı bulanık kümeleme teknikleri üzerindeki etkisi incelenmektedir. Bu amaçla farklı dört bulanık kümeleme algoritması kullanıldı: Bulanık C-Ortalamalar (BCO), Tip-2 Bulanık C-Ortalamalar (BCO2), Olasılıksal Bulanık C-Ortalamalar (OBCO) ve Denetimsiz Olasılıksal Bulanık C-Ortalamalar (DOBC). Boyut küçültme için verilerdeki varyansı minimum %80 açıklayan bir dizi bileşen seçildi. Boyutsallığın azaltılması için Kesik Tekil Değer Ayrıştırma (KTDA) tekniği kullanıldı. Çalışmada, ilk olarak, orijinal gerçek dünya veri kümeleri, bahsedilen dört yöntemle kümelendi. Daha sonra, bu veri kümelerinin boyutu küçültülmüş hali de yine bu dört yöntemle kümelendi. Kümeleme performansı için dört dahili kümeleme değerlendirme metriği kullanıldı. Bunlar Silhouette İndeksi (SI), Bölme Katsayısı (BK), Bölme Entropisi (BE) ve Kök Ortalama Kare Hatası (KOKH). Yöntemlerin, orijinal ve boyutu azaltılmış veri kümeleri için kümeleme performansı, karşılaştırmalı olarak sunulmaktadır. Sonuçlara göre, indirgenmiş veriler üzerinde, yöntemlerin performansı orijinal verilerden daha başarılıdır. Boyut azaltımının kümeleme başarısına katkısı en çok BCO için, en az BCO2 için elde edilmektedir.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 15 Ocak 2021 |
Yayımlandığı Sayı | Yıl 2021 Cilt: 4 Sayı: 1 |
Dergimizin Tarandığı Dizinler (İndeksler)
Academic Resource Index | Google Scholar | ASOS Index |
Rooting Index | The JournalTOCs Index | General Impact Factor (GIF) Index |
Directory of Research Journals Indexing | I2OR Index
|