Kümeleme, veri madenciliğinin hem araştırma hem de pratik uygulamalarında önemli bir tekniktir. Geleneksel olarak, anlamlı içgörüler elde etmek için etiketsiz verilerin düzenlenmesini kolaylaştıran önemli bir analitik metot olarak işlev yapmaktadır. Kümeleme zorluklarının doğasında var olan karmaşıklık, farklı tipte kümeleme algoritmalarının geliştirilmesini sağlamıştır. Bu algoritmaların her biri, belirli veri kümeleme senaryolarını ele almak için uyarlanmıştır. Bu bağlamda, bu makale, çeşitli alanlardaki zorlukları ve uygulamaları da dahil olmak üzere veri madenciliğindeki kümeleme tekniklerinin kapsamlı bir analizini sunmaktadır. Ayrıca, mesafe tabanlı, hiyerarşik, grid tabanlı ve yoğunluk tabanlı algoritmaları kapsayan farklı kümeleme metodolojilerini karakterize eden güçlü yönler ve sınırlamalar hakkında kapsamlı bir araştırma yapmaktadır. Ek olarak, sağlık hizmetleri, görüntü işleme, metin ve belge kümeleme ve büyük veri analitiği alanı dahil ancak bunlarla sınırlı olmamak üzere çeşitli alanlarda çok sayıda kümeleme algoritması örneği ve bunların ampirik sonuçları açıklanmaktadır.
Clustering is a crucial technique in both research and practical applications of data mining. It has traditionally functioned as a pivotal analytical technique, facilitating the organization of unlabeled data to extract meaningful insights. The inherent complexity of clustering challenges has led to the development of a variety of clustering algorithms. Each of these algorithms is tailored to address specific data clustering scenarios. In this context, this paper provides a thorough analysis of clustering techniques in data mining, including their challenges and applications in various domains. It also undertakes an extensive exploration of the strengths and limitations characterizing distinct clustering methodologies, encompassing distance-based, hierarchical, grid-based, and density-based algorithms. Additionally, it explains numerous examples of clustering algorithms and their empirical results in various domains, including but not limited to healthcare, image processing, text and document clustering, and the field of big data analytics.
Primary Language | English |
---|---|
Subjects | Data Mining and Knowledge Discovery |
Journal Section | PAPERS |
Authors | |
Publication Date | June 6, 2024 |
Submission Date | January 17, 2024 |
Acceptance Date | March 5, 2024 |
Published in Issue | Year 2024 |
The Creative Commons Attribution 4.0 International License is applied to all research papers published by JCS and
a Digital Object Identifier (DOI) is assigned for each published paper.