The number of people affected by obesity is rising steadily. Diagnosing obesity is crucial due to its harmful impacts on human health and it has become one of the world’s most important global health concerns. Therefore, it is crucial to develop methods that can enable early prediction of obesity risk and aid in mitigating the increasing prevalence of obesity. In the literature, some methods rely solely on Body Mass Index (BMI) for the prediction and classification of obesity may result in inaccurate outcomes. Additionally, more accurate predictions can be performed by developing machine learning models that incorporate additional factors such as individuals’ lifestyle and dietary habits, alongside height and weight used in BMI calculations. In this study, the potential of three different machine learning methods (naive Bayes, decision tree, and Random Forest (RF)) in predicting obesity levels were investigated. The best performance among the compared methods was obtained with RF (accuracy=0.8892, macro average F1-score=0.8618, Macro Average Precision (MAP)=0.8350, Macro Average Recall (MAR)=0.9122,). In addition, feature selection was also performed to determine the features that are significant for the estimation of the obesity level. According to the experimental results with feature selection, the RF method resulted in the highest score (accuracy=0.9236, MAP=0.9232, MAR=0.9358, macro average F1-score=0.9269) with fewer features. The results demonstrate that the performance of machine learning models on the same dataset can be enhanced through detailed hyperparameter tuning. Furthermore, applying feature selection can improve performance by mitigating the adverse effects of irrelevant or redundant features that may degrade the model’s effectiveness.
Obezitenin insan sağlığı üzerindeki zararlı etkileri ve obeziteden etkilenen bireylerin sayısı giderek artışı nedeniyle bu sorunun teşhis edilmesi büyük bir önem taşımaktadır. Obezitenin yaygınlaşması küresel sağlık açısından en önemli sorunlardan biri haline gelmesine yol açmıştır. Bu nedenle, obezite riskinin erken tespitini sağlayacak, ayrıca obezitenin artan yaygınlığını azaltmaya yardımcı olacak yöntemlerin geliştirilmesi elzemdir. Obezitenin öngörülmesi ve sınıflandırılması için yalnızca Beden Kitle İndeksine (BKİ) güvenmek hatalı sonuçlara yol açabilir. BKİ hesaplamalarında kullanılan boy ve kilonun yanı sıra bireylerin yaşam tarzı ve beslenme alışkanlıkları gibi ek faktörleri de içeren makine öğrenimi modelleri geliştirilerek daha doğru tahminler elde edilebilir. Bu çalışmada, üç farklı makine öğrenimi yönteminin (naive Bayes, karar ağacı ve Rasgele Orman (RF)) obezite seviyelerini tahmin etme potansiyeli araştırılmıştır. Karşılaştırılan yöntemler arasında en iyi performans RF ile elde edilmiştir (doğruluk=0,8892, makro ortalama F1-skor=0,8618, Makro Ortalama Kesinlik (MAP)=0,8350, Makro Ortalama Duyarlılık (MAR)=0,9122). Ayrıca, obezite seviyesini tahmin etmede etkili olan öznitelikleri belirlemek için öznitelik seçimi de yapılmıştır. Öznitelik seçimi ile elde edilen deneysel sonuçlara göre, RF yöntemi daha az öznitelik ile en yüksek skoru (doğruluk=0,9236, MAP=0,9232, MAR=0,9358, makro ortalama F1-skor=0,9269) elde etmiştir. Sonuçlar, makine öğrenimi modellerinin aynı veri kümesi üzerindeki performansının ayrıntılı hiperparametre ayarlamasıyla artırılabileceğini göstermektedir. Ayrıca, öznitelik seçimi uygulamak, modelin etkinliğini azaltabilecek ilgisiz veya gereksiz özniteliklerin olumsuz etkilerini azaltarak performansı artırabilir.
Primary Language | English |
---|---|
Subjects | Computing Applications in Health |
Journal Section | TJST |
Authors | |
Publication Date | March 27, 2025 |
Submission Date | October 23, 2024 |
Acceptance Date | December 3, 2024 |
Published in Issue | Year 2025 Volume: 20 Issue: 1 |