Asteroitler geçmişten günümüze kadar insanların dikkatini çekmektedir. Kadim medeniyetlerin inanç ve kültürlerinde de geniş yer almaktadır. İnsanoğlunun keşfetme ve merak duygusu bu cisimlere olan ilgisinin artmasına neden olmaktadır. Teknolojinin belirli bir seviyeye gelmesiyle asteroitlerin tespiti, teşhisi ve materyalleri net bir şekilde bulunabilmektedir. Bu cisimlerin izleyecekleri rota ve çarpışma etkileri sürekli olarak gözlem gerektirmektedir. Çalışmamızda Kaggle’da bulunan ve kaynağı NASA-JPL olan bir asteroit veri seti kullanılarak Dünya’ya çarpma ihtimali olan asteroitlerin sınıflandırılması yapılmıştır. Veri setinde 4687 asteroit verisi bulunmaktadır. Veriler üzerinde eksik verileri doldurulması, anomali tespit etme ve normalizasyon gibi ön işleme aşamaları uygulanmıştır. Daha sonra korelasyon yardımıyla tehlikelilik durumları için verisetinden 19 adet öznitelik tespit edilmiştir. Öznitelikler ile Karar Ağacı, Naive Bayes, Lojistik Regresyon, Rastgele Orman, Destek Vektör Makineleri, K-En Yakın Komşu, Xgboost ve Adaboost makine öğrenmesi algoritmaları kullanılarak asteroit sınıflandırması yapılmıştır. Farklı nöron ve katman sayılarına sahip yapay sinir ağı ile veriler eğitilmiş ve sınıflandırma algoritmaları ile karşılaştırılmıştır. Karşılaştırma sonucunda en yüksek başarımı %99.80 ile AdaBoost algoritması ile sağlanmıştır. Çalıştırılan tüm sınıflandırma algoritmalarında ızgara-arama yöntemi kullanılarak hiperparametre optimizasyonu yapılmıştır. Böylelikle sürekli gözlem gerektiren ve yüksek miktardaki verilerin daha performanslı bir şekilde işlenmesini sağlayan bir yöntem önerilmiştir.
Asteroids have attracted people's attention from the past to the present. It has a wide place in the beliefs and cultures of ancient civilizations. The sense of discovery and curiosity of human beings causes an increase in their interest in these objects. With the technology coming to a certain level, the detection, diagnosis and materials of asteroids can be found clearly. The route and collision effects of these objects require constant observation. In our study, asteroids that are likely to hit the Earth have been classified using an asteroid data set in Kaggle and the source of which is NASA-JPL. The dataset contains 4687 asteroid data. Pre-processing steps such as filling in missing data, anomaly detection and normalization were applied on the data. Then, with the help of correlation, 19 features were determined from the dataset for dangerous situations. Asteroid classification was made by using Decision Tree with features, Naive Bayes, Logistic Regression, Random Forest, Support Vector Machines, K-Nearest Neighbor, Xgboost and Adaboost machine learning algorithms. With the artificial neural network with different number of neurons and layers, the data were trained and compared with classification algorithms. As a result of the comparison, the highest performance was achieved with the AdaBoost algorithm with 99.80%. Hyperparameter optimization was performed using the grid-search method in all the classification algorithms that were run. Thus, a method that requires continuous observation and enables the processing of large amounts of data in a more efficient way has been proposed.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Makaleler |
Authors | |
Publication Date | December 31, 2022 |
Submission Date | June 25, 2022 |
Acceptance Date | September 7, 2022 |
Published in Issue | Year 2022 Volume: 9 Issue: 4 |