Araştırma Makalesi
BibTex RIS Kaynak Göster

EARTHQUAKE PREDICTION THROUGH ADVANCED FEATURE ENGINEERING AND MACHINE LEARNING

Yıl 2024, Cilt: 4 Sayı: 2, 11 - 26, 31.12.2024

Öz

Istanbul's geographical location places it on active fault lines and puts it in danger of earthquakes. As seen in history, the earthquake in 1509 is known as the "Little Apocalypse." This earthquake killed between 4000 and 13000 people, injured over 10000, and destroyed around 1070 homes in Constantinople, the Ottoman Empire's capital. More recently, during the 1999 Kocaeli earthquake, numerous structures in Istanbul were damaged, and many people died. This study uses machine learning techniques to assess the possible loss of life in the Great Istanbul Earthquake. According to the forecasts, the goal is to determine which places will have the greatest loss of life during the earthquake, to take safeguards in these areas ahead of time, to construct risk management plans for the potential Istanbul earthquake, and to develop emergency tactics. The study used prediction models such as Random Forest Regression, Linear Regression, XGBoost, SVM, Decision Tree Regression, Extra Trees, CatBoost, and Constrained ELM, and examined their interrelationships. It is observed that the LR model is more efficient than the other models used. mRMR, Boruta, and Mutual Information (MI) methods were used to pick features more efficiently. SHapley Additive ExPlanations (SHAP) analysis as Explainable Artificial Intelligence (XAI) was used to elucidate the decision mechanisms.

Kaynakça

  • Amiri, F. (2011). Mutual information-based feature selection for intrusion detection systems. Journal of Network and Computer Applications, 34(4), 1184-1199. https://doi.org/10.1016/j.jnca.2011.01.002
  • Aydınoğlu, A. Ç., & Taştan, B. (2015). Çoklu afet ve risk yönetiminde tehlike ve zarar görebilirlik belirlenmesi için gereksinim analizi. Marmara Coğrafya Dergisi, 31, 1-19.
  • Boğaziçi Üniversitesi Kandilli Rasathanesi ve Deprem Araştırma Enstitüsü. (2021). İstanbul İleri Erken Uyarı ve Risk Yönetim Sistemi (İERREWS) Raporu. İstanbul Büyükşehir Belediyesi. https://depremzemin.ibb.istanbul/uploads/prefix-ierrews-rapor-66a6a12ee02d7.pdf
  • Cortés, A., & Gualberto. (2015). Improving earthquake prediction with principal component analysis: Application to Chile. In Hybrid Artificial Intelligent Systems: 10th International Conference, HAIS 2015, Bilbao, Spain, June 22-24 (pp. 123-134). https://doi.org/10.1007/978-3-319-19644-2_33
  • Demir, A., Günay, S., & Marinković, M. (2022). Turkey earthquake: Advances in the past 2 decades, lessons learned, and future projections. Bulletin of Earthquake Engineering. https://doi.org/10.1007/s10518-024-01984-z
  • De Jay, N. (2013). mRMRe: An R package for parallelized mRMR ensemble feature selection. Bioinformatics, 29(18), 2365-2368. https://doi.org/10.1093/bioinformatics/btt383
  • Eyidoğan, H., & Balamir, M. (2010). Türkiye'de ve İstanbul'da deprem riskleri. ResearchGate. https://www.researchgate.net/publication/343962745_Turkiye%27de_ve_Istanbul%27da_Deprem_Riskleri
  • Eyidoğan, H. (2007). Marmara bölgesinin ve İstanbul kentinin deprem tehlikesi üzerine bir derleme. In TMMOB Afet Sempozyumu Bildiri Kitabı (ss. 15-29). Mattek Matbaacılık. İstanbul Büyükşehir Belediyesi. (2024). Veri seti: Deprem senaryosu analiz sonuçları. https://data.ibb.gov.tr/en/dataset/deprem-senaryosu-analiz-sonuclari
  • Kaptan, K. (2013). İstanbul’un deprem hazırlığı için ‘sıfır’ can kaybı projesi. Çukurova Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 28(1), 119-126.
  • Kursa, M. B., & Rudnicki, W. R. (2010). Feature selection with the Boruta package. Journal of Statistical Software, 36, 1-13. https://doi.org/10.18637/jss.v036.i11
  • Kursa, M. B., Jankowski, A., & Rudnicki, W. R. (2010). Boruta—A system for feature selection. Fundamenta Informaticae, 101(4), 271–285. https://doi.org/10.3233/FI-2010-288
  • Kundak, S., & Türkoğlu, H. (2007). İstanbul deprem risk analizi. İTÜ Dergisi/A, 6(2), 37–46.
  • Li, Z. (2022). Extracting spatial effects from machine learning models using local interpretation methods: An example of SHAP and XGBoost. Computers, Environment and Urban Systems, 96, 101845. https://doi.org/10.1016/j.compenvurbsys.2022.101845
  • Liu, Y. (2022). Diagnosis of Parkinson's disease based on SHAP value feature selection. Journal Name, 42(3), 856–869. https://doi.org/10.1016/j.bbe.2022.06.007
  • Liu, Y., Wang, Z., & Zhang, X. (2024). Estimating the final fatalities using early reported death count from the 2023 Kahramanmaraş, Türkiye, MS 8.0–7.9 earthquake doublet and revising the estimates over time. Earthquake Research Advances, 100331. https://doi.org/10.1016/j.eqrea.2024.100331
  • Magdeburger Sigorta. (2024). Türkiye’deki deprem bölgeleri. Magdeburger Sigorta Blogu. https://www.magdeburger.com.tr/blog/turkiye-deki-deprem-bolgeleri-nerelerdir
  • Marcílio, W. E., & Eler, D. M. (2020). From explanations to feature selection: Assessing SHAP values as a feature selection mechanism. In Proceedings of the 33rd SIBGRAPI Conference on Graphics, Patterns and Images (SIBGRAPI). https://doi.org/10.1109/SIBGRAPI51738.2020.00053
  • Mosca, E., Szigeti, F., Tragianni, S., Gallagher, D., & Groh, G. (2022, October). SHAP-based explanation methods: A review for NLP interpretability. In Proceedings of the 29th International Conference on Computational Linguistics (pp. 4593–4603).
  • Parmaksız, H., & Karakuzu, C. (2022). Performance analysis of Extreme Learning Machine classifiers on radio frequency fingerprinting. BSEU Journal of Engineering Research and Technology.
  • Rajasekaran, S., Latha, V., & Lee, S. C. (2006). Generation of artificial earthquake motion records using wavelets and principal component analysis. Journal of Earthquake Engineering, 10(5), 665–691.
  • Slundberg, S. (n.d.). SHAP GitHub source. GitHub. https://github.com/slundberg/shap.
  • Tianqi, C., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. https://doi.org/10.1145/2939672.2939785
  • Toğaçar, M. (2020). A deep feature learning model for pneumonia detection applying a combination of mRMR feature selection and machine learning models. Journal Name, 41(4), 212–222. https://doi.org/10.1016/j.irbm.2019.10.006
  • Vergara, J. R., & Estévez, P. A. (2014). A review of feature selection methods based on mutual information. Neural Computing and Applications, 24, 175–186.
  • Wang, H. (2024). Feature selection strategies: A comparative analysis of SHAP-value and importance-based methods. Journal Name, 11(1), 44. https://doi.org/10.1186/s40537-024-00905-w
  • Wang, J., Lu, S., Wang, S. H., & diğerleri. (2022). Aşırı öğrenme makinesi üzerine bir inceleme. Multimedia Tools and Applications, 81(4), 41611–41660. https://doi.org/10.1007/s11042-021-11007-7

GELİŞMİŞ ÖZELLİK MÜHENDİSLİĞİ VE MAKİNE ÖĞRENİMİ İLE DEPREM TAHMİNİ

Yıl 2024, Cilt: 4 Sayı: 2, 11 - 26, 31.12.2024

Öz

İstanbul'un coğrafi konumu onu aktif fay hatları üzerinde konumlandırmakta ve deprem tehlikesiyle karşı karşıya bırakmaktadır. Tarihte görüldüğü üzere, 1509 yılında meydana gelen deprem “Kıyamet-i Suğra” olarak bilinmektedir. Bu depremde 4000 ila 13000 kişi ölmüş, 10000'den fazla kişi yaralanmış ve Osmanlı İmparatorluğu'nun başkenti Konstantinopolis'te yaklaşık 1070 ev yıkılmıştır. Daha yakın bir tarihte, 1999 Kocaeli depreminde İstanbul'da çok sayıda yapı hasar görmüş ve çok sayıda insan hayatını kaybetmiştir. Bu çalışma, Büyük İstanbul Depremi'ndeki olası can kaybını değerlendirmek için makine öğrenimi tekniklerini kullanmaktadır. Tahminlere göre, deprem sırasında en fazla can kaybının hangi bölgelerde yaşanacağının belirlenmesi, bu bölgelerde önceden önlem alınması, olası İstanbul depremi için risk yönetim planlarının oluşturulması ve acil durum taktiklerinin geliştirilmesi amaçlanmaktadır. Çalışmada Rastgele Orman Regresyonu (RF), Doğrusal Regresyon (LR), Aşırı Gradyan Artırma (XGBoost), Destek Vektör Makinesi (SVM), Karar Ağacı Regresyonu (DT), Ekstra Ağaçlar (ET), Kategorik Artırma (CatBoost) ve Kısıtlı Aşırı Öğrenme Makinesi (CELM) gibi tahmin modelleri kullanılmış ve aralarındaki ilişkiler incelenmiştir. LR modelinin kullanılan diğer modellere kıyasla daha etkin olduğu gözlemlenmiştir. mRMR, Boruta ve Karşılıklı Bilgi (MI) yöntemleri özelliklerin daha verimli seçilmesi için kullanılmıştır. Karar mekanizmalarını aydınlatmak için Açıklanabilir Yapay Zeka olarak Shapley Toplamalı Açıklamalar (SHAP) analizi kullanılmıştır.

Kaynakça

  • Amiri, F. (2011). Mutual information-based feature selection for intrusion detection systems. Journal of Network and Computer Applications, 34(4), 1184-1199. https://doi.org/10.1016/j.jnca.2011.01.002
  • Aydınoğlu, A. Ç., & Taştan, B. (2015). Çoklu afet ve risk yönetiminde tehlike ve zarar görebilirlik belirlenmesi için gereksinim analizi. Marmara Coğrafya Dergisi, 31, 1-19.
  • Boğaziçi Üniversitesi Kandilli Rasathanesi ve Deprem Araştırma Enstitüsü. (2021). İstanbul İleri Erken Uyarı ve Risk Yönetim Sistemi (İERREWS) Raporu. İstanbul Büyükşehir Belediyesi. https://depremzemin.ibb.istanbul/uploads/prefix-ierrews-rapor-66a6a12ee02d7.pdf
  • Cortés, A., & Gualberto. (2015). Improving earthquake prediction with principal component analysis: Application to Chile. In Hybrid Artificial Intelligent Systems: 10th International Conference, HAIS 2015, Bilbao, Spain, June 22-24 (pp. 123-134). https://doi.org/10.1007/978-3-319-19644-2_33
  • Demir, A., Günay, S., & Marinković, M. (2022). Turkey earthquake: Advances in the past 2 decades, lessons learned, and future projections. Bulletin of Earthquake Engineering. https://doi.org/10.1007/s10518-024-01984-z
  • De Jay, N. (2013). mRMRe: An R package for parallelized mRMR ensemble feature selection. Bioinformatics, 29(18), 2365-2368. https://doi.org/10.1093/bioinformatics/btt383
  • Eyidoğan, H., & Balamir, M. (2010). Türkiye'de ve İstanbul'da deprem riskleri. ResearchGate. https://www.researchgate.net/publication/343962745_Turkiye%27de_ve_Istanbul%27da_Deprem_Riskleri
  • Eyidoğan, H. (2007). Marmara bölgesinin ve İstanbul kentinin deprem tehlikesi üzerine bir derleme. In TMMOB Afet Sempozyumu Bildiri Kitabı (ss. 15-29). Mattek Matbaacılık. İstanbul Büyükşehir Belediyesi. (2024). Veri seti: Deprem senaryosu analiz sonuçları. https://data.ibb.gov.tr/en/dataset/deprem-senaryosu-analiz-sonuclari
  • Kaptan, K. (2013). İstanbul’un deprem hazırlığı için ‘sıfır’ can kaybı projesi. Çukurova Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 28(1), 119-126.
  • Kursa, M. B., & Rudnicki, W. R. (2010). Feature selection with the Boruta package. Journal of Statistical Software, 36, 1-13. https://doi.org/10.18637/jss.v036.i11
  • Kursa, M. B., Jankowski, A., & Rudnicki, W. R. (2010). Boruta—A system for feature selection. Fundamenta Informaticae, 101(4), 271–285. https://doi.org/10.3233/FI-2010-288
  • Kundak, S., & Türkoğlu, H. (2007). İstanbul deprem risk analizi. İTÜ Dergisi/A, 6(2), 37–46.
  • Li, Z. (2022). Extracting spatial effects from machine learning models using local interpretation methods: An example of SHAP and XGBoost. Computers, Environment and Urban Systems, 96, 101845. https://doi.org/10.1016/j.compenvurbsys.2022.101845
  • Liu, Y. (2022). Diagnosis of Parkinson's disease based on SHAP value feature selection. Journal Name, 42(3), 856–869. https://doi.org/10.1016/j.bbe.2022.06.007
  • Liu, Y., Wang, Z., & Zhang, X. (2024). Estimating the final fatalities using early reported death count from the 2023 Kahramanmaraş, Türkiye, MS 8.0–7.9 earthquake doublet and revising the estimates over time. Earthquake Research Advances, 100331. https://doi.org/10.1016/j.eqrea.2024.100331
  • Magdeburger Sigorta. (2024). Türkiye’deki deprem bölgeleri. Magdeburger Sigorta Blogu. https://www.magdeburger.com.tr/blog/turkiye-deki-deprem-bolgeleri-nerelerdir
  • Marcílio, W. E., & Eler, D. M. (2020). From explanations to feature selection: Assessing SHAP values as a feature selection mechanism. In Proceedings of the 33rd SIBGRAPI Conference on Graphics, Patterns and Images (SIBGRAPI). https://doi.org/10.1109/SIBGRAPI51738.2020.00053
  • Mosca, E., Szigeti, F., Tragianni, S., Gallagher, D., & Groh, G. (2022, October). SHAP-based explanation methods: A review for NLP interpretability. In Proceedings of the 29th International Conference on Computational Linguistics (pp. 4593–4603).
  • Parmaksız, H., & Karakuzu, C. (2022). Performance analysis of Extreme Learning Machine classifiers on radio frequency fingerprinting. BSEU Journal of Engineering Research and Technology.
  • Rajasekaran, S., Latha, V., & Lee, S. C. (2006). Generation of artificial earthquake motion records using wavelets and principal component analysis. Journal of Earthquake Engineering, 10(5), 665–691.
  • Slundberg, S. (n.d.). SHAP GitHub source. GitHub. https://github.com/slundberg/shap.
  • Tianqi, C., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. https://doi.org/10.1145/2939672.2939785
  • Toğaçar, M. (2020). A deep feature learning model for pneumonia detection applying a combination of mRMR feature selection and machine learning models. Journal Name, 41(4), 212–222. https://doi.org/10.1016/j.irbm.2019.10.006
  • Vergara, J. R., & Estévez, P. A. (2014). A review of feature selection methods based on mutual information. Neural Computing and Applications, 24, 175–186.
  • Wang, H. (2024). Feature selection strategies: A comparative analysis of SHAP-value and importance-based methods. Journal Name, 11(1), 44. https://doi.org/10.1186/s40537-024-00905-w
  • Wang, J., Lu, S., Wang, S. H., & diğerleri. (2022). Aşırı öğrenme makinesi üzerine bir inceleme. Multimedia Tools and Applications, 81(4), 41611–41660. https://doi.org/10.1007/s11042-021-11007-7
Toplam 26 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgi Sistemleri (Diğer)
Bölüm Araştırma Makaleleri
Yazarlar

Hüseyin Parmaksız 0000-0001-8455-5625

Zeynep Özer 0009-0002-1965-2685

Yayımlanma Tarihi 31 Aralık 2024
Gönderilme Tarihi 8 Ekim 2024
Kabul Tarihi 10 Kasım 2024
Yayımlandığı Sayı Yıl 2024 Cilt: 4 Sayı: 2

Kaynak Göster

APA Parmaksız, H., & Özer, Z. (2024). GELİŞMİŞ ÖZELLİK MÜHENDİSLİĞİ VE MAKİNE ÖĞRENİMİ İLE DEPREM TAHMİNİ. Rahva Journal of Technical and Social Studies, 4(2), 11-26.