Araştırma Makalesi
BibTex RIS Kaynak Göster

Destek Vektör Makineleri ve Naive Bayes Sınıflandırma Algoritmalarını Kullanarak Diabetes Mellitus Tahmini

Yıl 2021, Sayı: 32, 7 - 13, 31.12.2021
https://doi.org/10.31590/ejosat.1041186

Öz

Makine öğrenmesi, herhangi bir insan müdahalesi olmadan elde olan verilerden veya analizlerinden daha iyi sonuçlar elde edilmesine yardımcı olan alanlardan biridir. Ciddi ve karmaşık durumları analiz etmek ve doğruluk oranı yüksek tahminlerde bulunmak için son yıllarda gelişen teknolojiyle birlikte özellikte tıbbi teşhis alanında yaygın olarak kullanılmaktadır. Bu çalışma kapsamında Pima Indians Diyabet veri seti (Pima Indian Diabetes Dataset) üzerinde Naive Bayes ve Destek Vektör Makineleri (DVM) makine öğrenme algoritmaları kullanılarak diyabet hastalığı erken evrede teşhis edilmeye çalışılmıştır. Kullanılan sınıflandırıcıların performanslarını artırmak için veri setinde eksik değerler çarpıklık durumuna göre tekrar yapılandırılmış, veri standardizasyonu standart ölçeklendirme kullanılarak yapılmıştır. Ayrıca sınıf dengesizlik probleminin sınıflandırma üzerindeki olumsuz etkisini azaltmak için Sentetik Azınlık Aşırı-Örnekleme (SMOTE) tekniği kullanılmıştır. Çalışma kapsamında oluşturulan sınıflandırıcıların değerlendirme kriterleri Doğruluk Oranı (Accuracy Rate), Kesinlik (Precision), Duyarlılık (Recall) ve F1-Skore (F1 Score) metrikleri kullanılarak hesaplanmıştır. Destek Vektör Makineleri %90 doğruluk oranı ile en iyi sunucu vermiştir.

Kaynakça

  • https://www.who.int/health-topics/diabetes#tab=tab_1,21 Mayıs 2021 tarihinde alındı. (Erişim Tarihi: 31.05.2021).
  • Özlüer Başer, B. , Yangın, M. & Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120. DOI: 10.19113/sdufenbed.842460.
  • Srinivasa R, Yashashwini, Shubham janakatti, Venkatesh K B, Yaswanth S P. (2020). Prediction of Diabetes using Machine Learning. International Journal of Advanced Science and Technology, 29(06), 7593 - 7601.
  • Kayaer, K., & Yıldırım, T. (2003). MEDICAL DIAGNOSIS ON PIMA INDIAN DIABETES USING GENERAL REGRESSION NEURAL NETWORKS. Proceedings of the International Conference on Artificial Neural Networks and Neural Information Processing, 2003.
  • Bilgin, G. (2021). Makine Öğrenmesi Algoritmaları Kullanarak Erken Dönemde Diyabet Hastalığı Riskinin Araştırılması . Journal of Intelligent Systems: Theory and Applications , 4 (1) , 55-64 . DOI: 10.38016/jista.877292.
  • Maniruzzaman, M., Rahman, M.J., Ahammed, B. (2020). Classification and prediction of diabetes disease using machine learning paradigm. Health Inf Sci Syst. 8, 7. https://doi.org/10.1007/s13755-019-0095-z.
  • Turhan, S., Yüksel, Ö., Şarer Yürekli, B. P., Suner, A., Doğu E. (2020) . Sınıf Dengesizliği Varlığında Hastalık Tanısı için Kolektif Öğrenme Yöntemlerinin Karşılaştırılması: Diyabet Tanısı Örneği. Türkiye Klinikleri Biyoistatistik Dergisi. 12 (1), 16-26. DOI: 10.5336/biostatic.2019-66816.
  • Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. (2002. SMOTE). synthetic minority over-sampling technique. J. Artif. Int. Res. 16, 1 , 321–357
  • Cover, T. M. (1965). Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Trans. Electron. Comput. 14 (3), 326–334.
  • Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018.
  • Qi, Z., Tian, Y., & Shi, Y. (2013). Robust twin support vector machine for pattern classification. Pattern Recognit., 46, 305-316

Prediction of Diabetes Mentillus by Using SVM and Naive Bayes Classification Algorithms

Yıl 2021, Sayı: 32, 7 - 13, 31.12.2021
https://doi.org/10.31590/ejosat.1041186

Öz

Machine learning is one of the fields that help to get better results from data or analysis without any human intervention. In recent years with the developing technology, it is widely used in the field of medical diagnosis, especially to analyze serious and complex situations and make predictions with high accuracy. In this study, it was tried to diagnose diabetic disease at an early stage by using Naïve Bayes and Support Vector Machines (DVM) machine learning algorithms on Pima Indians Diabetes Dataset. In order to increase the performance of the classifiers used, the missing values in the data set were restructured according to the skewness, and data standardization was done using standard scaling. Then, the Synthetic Minority Oversampling (SMOTE) technique was used to reduce the negative effect of class imbalance problem on classification. Evaluation criteria of the classifiers created within the scope of the study were calculated by using Accuracy Rate, Precision, Recall and F1-Score (F1 Score) values. According to these results, Support Vector Machines gave the best server with 88% accuracy rate.

Kaynakça

  • https://www.who.int/health-topics/diabetes#tab=tab_1,21 Mayıs 2021 tarihinde alındı. (Erişim Tarihi: 31.05.2021).
  • Özlüer Başer, B. , Yangın, M. & Sarıdaş, E. S. (2021). Makine Öğrenmesi Teknikleriyle Diyabet Hastalığının Sınıflandırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 25(1), 112-120. DOI: 10.19113/sdufenbed.842460.
  • Srinivasa R, Yashashwini, Shubham janakatti, Venkatesh K B, Yaswanth S P. (2020). Prediction of Diabetes using Machine Learning. International Journal of Advanced Science and Technology, 29(06), 7593 - 7601.
  • Kayaer, K., & Yıldırım, T. (2003). MEDICAL DIAGNOSIS ON PIMA INDIAN DIABETES USING GENERAL REGRESSION NEURAL NETWORKS. Proceedings of the International Conference on Artificial Neural Networks and Neural Information Processing, 2003.
  • Bilgin, G. (2021). Makine Öğrenmesi Algoritmaları Kullanarak Erken Dönemde Diyabet Hastalığı Riskinin Araştırılması . Journal of Intelligent Systems: Theory and Applications , 4 (1) , 55-64 . DOI: 10.38016/jista.877292.
  • Maniruzzaman, M., Rahman, M.J., Ahammed, B. (2020). Classification and prediction of diabetes disease using machine learning paradigm. Health Inf Sci Syst. 8, 7. https://doi.org/10.1007/s13755-019-0095-z.
  • Turhan, S., Yüksel, Ö., Şarer Yürekli, B. P., Suner, A., Doğu E. (2020) . Sınıf Dengesizliği Varlığında Hastalık Tanısı için Kolektif Öğrenme Yöntemlerinin Karşılaştırılması: Diyabet Tanısı Örneği. Türkiye Klinikleri Biyoistatistik Dergisi. 12 (1), 16-26. DOI: 10.5336/biostatic.2019-66816.
  • Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. (2002. SMOTE). synthetic minority over-sampling technique. J. Artif. Int. Res. 16, 1 , 321–357
  • Cover, T. M. (1965). Geometrical and statistical properties of systems of linear inequalities with applications in pattern recognition. IEEE Trans. Electron. Comput. 14 (3), 326–334.
  • Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297. http://dx.doi.org/10.1007/BF00994018.
  • Qi, Z., Tian, Y., & Shi, Y. (2013). Robust twin support vector machine for pattern classification. Pattern Recognit., 46, 305-316
Toplam 11 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler
Yazarlar

Güneş Harman 0000-0001-5413-124X

Yayımlanma Tarihi 31 Aralık 2021
Yayımlandığı Sayı Yıl 2021 Sayı: 32

Kaynak Göster

APA Harman, G. (2021). Destek Vektör Makineleri ve Naive Bayes Sınıflandırma Algoritmalarını Kullanarak Diabetes Mellitus Tahmini. Avrupa Bilim Ve Teknoloji Dergisi(32), 7-13. https://doi.org/10.31590/ejosat.1041186