Amaç: Bu çalışma, açık erişimli COVID-19 negatif ve pozitif hastalardan oluşan gen veri seti üzerinde ilişkisel sınıflandırma yöntemini uygulayarak COVID-19'u sınıflandırmayı ve COVID-19'a neden olan genleri tanımlayarak bu genlerle hastalık ilişkisini ortaya çıkarmayı amaçlamaktadır.
Gereç ve Yöntem: Bu çalışmada açık erişimli COVID-19 olan ve olmayan hastaların gen veri setine ilişkisel sınıflandırma yöntemi uygulandı. Kullanılan açık erişimli veri setinde 234 kişiye ait 15979 gen bulunmaktadır. 234 kişiden 141'i (%60.3) COVID-19 negatif ve 93'ü (%39.7) COVID-19 pozitifti. Bu çalışmada, ilgili tahmin edici değişkenleri seçmek için değişken seçim yöntemlerinden LASSO gerçekleştirilmiştir. Modelin performansı doğruluk, dengelenmiş doğruluk, duyarlılık, seçicilik, pozitif tahmin değeri, negatif tahmin değeri ve F1 skoru ile değerlendirildi.
Bulgular: Çalışmanın bulgularına göre, ilişkisel sınıflandırma yönteminden performans ölçütleri doğruluk %92.70, dengelenmiş doğruluk %91.80, duyarlılık %87.10, seçicilik %96.50, pozitif tahmin değeri %94.20, negatif tahmin değeri %91.90 ve F1 puanı %90.50 olarak elde edilmiştir.
Sonuç: Önerilen ilişkisel sınıflandırma yöntemi, COVID-19'u sınıflandırmada çok yüksek performans elde etmiştir. Genlerle ilgili çıkarılan birliktelik kuralları, hastalığın teşhis ve tedavisine yardımcı olabilir.
Objective: This study aims to classify COVID-19 by applying the associative classification method on the gene data set consisting of open access COVID-19 negative and positive patients and revealing the disease relationship with these genes by identifying the genes that cause COVID-19.
Method: In the study, an associative classification model was applied to the gene data set of patients with and without open access COVID-19. In this open-access data set used, 15979 genes are belonging to 234 individuals. Out of 234 people, 141 (60.3%) were COVID-19 negative and 93 (39.7%) were COVID-19 positives. In this study, LASSO, one of the feature selection methods, was performed to choose the relevant predictors. The models' performance was evaluated with accuracy, balanced accuracy, sensitivity, specificity, positive predictive value, negative predictive value, and F1-score.
Results: According to the study findings, the performance metrics from the associative classification model were accuracy of 92.70%, balanced accuracy of 91.80%, the sensitivity of 87.10%, the specificity of 96.50%, the positive predictive value of 94.20%, the negative predictive value of 91.90%, and F1-score of 90.50%.
Conclusion: The proposed associative classification model achieved very high performances in classifying COVID-19. The extracted association rules related to the genes can help diagnose and treat the disease.
Primary Language | English |
---|---|
Subjects | Health Care Administration |
Journal Section | Articles |
Authors | |
Publication Date | March 14, 2022 |
Acceptance Date | November 4, 2021 |
Published in Issue | Year 2022 Volume: 14 Issue: 1 |