In digital image processing, image segmentation is an essential step in which an image is partitioned into groups of pixels. k-means clustering algorithm, which is often considered as fast and efficient, is one of the most widely used clustering algorithms to segment an image. However, as the problem size gets larger, the k-means starts to spend a significant amount of time to process. At this point, parallelization techniques should be applied to reduce the required time. Designing an efficient parallel and distributed model is not a trivial job since it should correspond to the parallel computer architecture and take communication and load balancing among processors into account. In this study, we propose a parallel and distributed k-means clustering algorithm with naive sharding centroid initialization for image segmentation. The proposed algorithm adopts the Message Passing Interface (MPI) standard to take advantage of the computational power of distributed computing nodes in a High Performance Computing Cluster. We demonstrate the parallel scalability of the proposed algorithm using up to 128 cores that achieves approximately 104 times faster clustering time.
Dijital görüntü işlemede, görüntü bölütleme, görüntünün piksel gruplarına ayrıldığı önemli bir adımdır. Verimli bir kümeleme algoritması kabul edilen k-means algoritması, bir görüntüyü bölümlere ayırmak için en yaygın kullanılan kümeleme algoritmalarından birisidir. Bununla birlikte, problem boyutu büyüdükçe, k-means, görüntü işlemek için önemli miktarda zaman harcamaya başlar. Bu noktada, gerekli zamanı azaltmak için paralelleştirme teknikleri uygulanmalıdır. Verimli bir paralel ve dağıtılmış model tasarlamak, paralel bilgisayar mimarisini karşılayabilmesi ve işlemciler arasındaki iletişim ve yük dengelemesini dikkate alması nedeniyle önemli bir iştir. Bu çalışmada, görüntü bölütlemesi için naïve sharding kullanarak orta nokta belirleme ile paralel ve dağıtılmış bir k-means kümeleme algoritması öneriyoruz. Önerilen algoritma, Yüksek Performanslı Bilgi İşleme Kümesindeki dağıtılmış bilgi işleme düğümlerinin hesaplama gücünden yararlanmak için Mesaj Geçirme Arayüzü (MGA) standardını kullanır. 128 adede kadar çekirdek kullanarak 104.23 kat daha hızlı kümeleme süresi sağlayan önerilen algoritmanın paralel ölçeklenebilirliğini gösterdik.
Primary Language | English |
---|---|
Subjects | Computer Software |
Journal Section | Research Articles |
Authors | |
Publication Date | September 24, 2020 |
Submission Date | June 4, 2020 |
Acceptance Date | September 9, 2020 |
Published in Issue | Year 2020 Volume: 8 Issue: 3 |