Research Article
BibTex RIS Cite

Veri Madenciliği Birliktelik Kuralları Yöntemi Kullanarak Binaların Risk Durumlarının Belirlenmesi

Year 2020, Volume: 6 Issue: 1, 70 - 78, 30.04.2020

Abstract

Günümüzde üretilen verilerin hacimleri ve çeşitlilikleri arttıkça büyük veriye yönelik ilgi de artmaktadır. Çok çeşitli verinin analiziyle anlamlı sonuçlar elde edilmesine yönelik teknikler veri madenciliği kavramını ifade etmektedir. Veri madenciliğinin temel tekniklerinden biri olan Birliktelik Kuralları, farklı olayların birlikte gerçekleşebilme durumlarının tespit edilmesidir. Oluşturulan veri setinin analizi sonucunda veriler arasında bulunan birliktelik bağıntılarının elde edilmesi yani bir ya da birkaç durum var ise sonucunda belli durumlar olabilir şeklinde çıkarımlarda bulunulabilmektedir.
Bu çalışmada Düzce ili Kaynaşlı ilçesinde yer alan 2112 binaya ait deprem riski puanlama verileri kullanılmıştır. Bu veriler binalar ile ilgili kat yüksekliği, kullanım durumu, bina malzemesi, 1999 depremi öncesi yada sonrası inşa durumu ve elde edilen risk puanları ile birlikte eğim, jeoloji, taşıma gücü, zemin titreşim, zemin sınıfı, zemin büyütme ve yer altı suyu altlık haritalarının binaların konumlarıyla kesiştirilmesi sonucunda coğrafi bilgi sistemleri kullanılarak elde edilen veriler ile bir veri seti oluşturulmuştur. Bu veri seti kullanılarak veri madenciliği araçlarından Orange ve Weka ile birliktelik kuralları çıkarılmıştır. Elde edilen sonuçlara göre bir binanın yerel deprem puanı 93.5’den büyük ve zemin titreşimi 0.10-0.20 aralığında ise düşük riskli, bina 2 katlı ve düşük riskli ise yerel deprem puanı 93.5’den büyük ve meskendir gibi çıkarımlar yapılabilmektedir. Birliktelik kurallarının kullanımı ile mevcut verilerin birbiri ile ilişki durumları ortaya çıkarılabilmektedir.

References

  • [1] R. Amornchewin and W. Kreesuradej, “Probability-based incremental association rule discovery algorithm,” Proceedings - International Symposium on Computer Science and Its Applications, CSA 2008, pp. 212–215, 2008.
  • [2] J. K. Chahal, “Finding Association Rules in Medical Datasets,” no. April, 2019.
  • [3] Y. Shen, J. Liu, and J. Shen, “The further development of Weka base on positive and negative association rules,” 2010 International Conference on Intelligent Computation Technology and Automation, ICICTA 2010, vol. 3, pp. 811–814, 2010.
  • [4] K. Rameshkumar, M. Sambath, and S. Ravi, “Relevant association rule mining from medical dataset using new irrelevant rule elimination technique,” 2013 International Conference on Information Communication and Embedded Systems, ICICES 2013, pp. 300–304, 2013.
  • [5] R. Agrawal, T. Imieliński, and A. Swami, “Mining association rules between sets of items in large databases,” ACM SIGMOD Record, vol. 22, no. 2, pp. 207–216, Jun. 1993.
  • [6] Y. Zhong and Y. Liao, “Research of mining effective and weighted association rules based on dual confidence,” Proceedings - 4th International Conference on Computational and Information Sciences, ICCIS 2012, pp. 1228–1231, 2012.
  • [7] J. Feng, Q. Zeng, and Z. Zhang, “A method of mining the meta-association rules for dynamic association rule based on the model of AR-markov,” NSWCTC 2010 - The 2nd International Conference on Networks Security, Wireless Communications and Trusted Computing, vol. 2, pp. 210–214, 2010.
  • [8] S. Naredi and R. A. Deshmukh, “Improved extraction of quantitative rules using Best M Positive Negative Association Rules Algorithm,” 2015 IEEE International Conference on Electronics, Computing and Communication Technologies, CONECCT 2015, pp. 1–5, 2016.
  • [9] X. Piao, Z. Wang, and G. Liu, “Research on mining positive and negative association rules based on dual confidence,” Proceedings - 5th International Conference on Internet Computing for Science and Engineering, ICICSE 2010, pp. 102–105, 2011.
  • [10] W. Ouyang and Q. Huang, “Mining direct and indirect weighted fuzzy association rules in large transaction databases,” 6th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2009, vol. 3, pp. 128–132, 2009.
  • [11] X. S. Xiong, L. Fan, and Z. Lei, “Ontology-Based Association Rule Quality Evaluation Using Information Theory,” in 2010 International Conference on Computational and Information Sciences, 2010, pp. 170–173.
  • [12] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, “The WEKA data mining software,” ACM SIGKDD Explorations Newsletter, vol. 11, no. 1, p. 10, Nov. 2009.
  • [13] J. Demšar et al., “Orange: Data Mining Toolbox in Python,” Journal of Machine Learning Research, vol. 14, pp. 2349–2353, 2013.
  • [14] H. Bayraktar, “CBS ve Sokak Taraması Yöntemleri Kullanılarak Düzce- Kaynaşlı İlçesinin Afet Riski Yönünden Yerleşim Durumunun Belirlenmesi ve Yerel Afet Risk Yönetimi,” Gazi Üniversitesi, 2014.
  • [15] “QGIS.” [Online]. Available: https://www.qgis.org/en/site/about. [Accessed: July, 15, 2019].
  • [16] İ. B. Aydilek, “Veri Kümelerindeki Eksik Değerlerin Yeni Yaklaşımlar Kullanılarak Hesaplanması,” Selçuk Üniversitesi, 2013.
  • [17] D. Sağaltıcı, F. D. Alay, C. Efil, and N. İlhan, “Veri Madenciliği Yöntemleri İle Meteorolojik Verilerden Kayıp Güneş Işınım Değerlerinin Tahmini,” Harran Üniversitesi Mühendislik Dergisi, vol. 02, pp. 49–53, 2018.
  • [18] F. C. ÖZÇAKIR and A. Y. ÇAMURCU, “Birliktelik Kuralı Yöntemi İçin Bir Veri Madenciliği Yazılımı Tasarımı Ve Uygulaması,” İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, vol. 6, no. 12, pp. 21–37.
  • [19] A. C. GÜLCE, “Veri Madenciliğinde Apriori Algoritması ve Apriori Algoritmasının Farklı Veri Kümelerinde Uygulanması,” Trakya Üniversitesi, 2010.
  • [20] H. SEVER and B. OĞUZ, ““Veritabanlarında Bilgi Keşfine Formal bir Yaklaşım, Kısım 1: Eşleştirme Sorguları ve Algoritmalar,” Bilgi Dünyası, vol. 3, no. 2, 2002.
  • [21] “Validation and Testing accuracy widely different.” [Online]. Available: https://stackoverflow.com/questions/48718663/validation-and-testing-accuracy-widely-different. [Accessed: July, 15, 2019].
  • [22] M. Hahsler, “A Probabilistic Comparison of Commonly Used Interest Measures for Association Rules.” [Online]. Available: https://michael.hahsler.net/research/association_rules/measures.html. [Accessed: July, 15, 2019].

Determination of Risk Stituations of Buildings with Using Data Mining Association Rules Method

Year 2020, Volume: 6 Issue: 1, 70 - 78, 30.04.2020

Abstract

Nowadays, as the volume and diversity of the produced data increases, so does the interest in big data. Techniques for obtaining meaningful results by analyzing a wide variety of data express the concept of data mining. One of the basic techniques of data mining, Association Rules, is to determine the co-occurrence of different events. The result of the analysis of the data set can be derived from the association relations between the data, that is, if there are one or more situations, there may be certain situations.
In this study, earthquake risk scoring data of 2112 buildings in Kaynaşlı district of Düzce province were used. These data include the building height, usage status, building material, construction status before or after the 1999 earthquake and the risk scores obtained along with slope, geology, bearing capacity, soil vibration, soil class, soil magnification and groundwater litter maps. A data set was formed with the data obtained by using geographical information systems. Using this data set, the rules of association with Orange and Weka have been drawn from the data mining tools. According to the results obtained, the local earthquake score of a building is greater than 93.5 and the ground vibration is in the range of 0.10-0.20, the result is low risk. If the building has 2 floors and low risk, it can be deduced that the local earthquake score is greater than 93.5 and residential. By using association rules, the relationship between existing data can be revealed.

References

  • [1] R. Amornchewin and W. Kreesuradej, “Probability-based incremental association rule discovery algorithm,” Proceedings - International Symposium on Computer Science and Its Applications, CSA 2008, pp. 212–215, 2008.
  • [2] J. K. Chahal, “Finding Association Rules in Medical Datasets,” no. April, 2019.
  • [3] Y. Shen, J. Liu, and J. Shen, “The further development of Weka base on positive and negative association rules,” 2010 International Conference on Intelligent Computation Technology and Automation, ICICTA 2010, vol. 3, pp. 811–814, 2010.
  • [4] K. Rameshkumar, M. Sambath, and S. Ravi, “Relevant association rule mining from medical dataset using new irrelevant rule elimination technique,” 2013 International Conference on Information Communication and Embedded Systems, ICICES 2013, pp. 300–304, 2013.
  • [5] R. Agrawal, T. Imieliński, and A. Swami, “Mining association rules between sets of items in large databases,” ACM SIGMOD Record, vol. 22, no. 2, pp. 207–216, Jun. 1993.
  • [6] Y. Zhong and Y. Liao, “Research of mining effective and weighted association rules based on dual confidence,” Proceedings - 4th International Conference on Computational and Information Sciences, ICCIS 2012, pp. 1228–1231, 2012.
  • [7] J. Feng, Q. Zeng, and Z. Zhang, “A method of mining the meta-association rules for dynamic association rule based on the model of AR-markov,” NSWCTC 2010 - The 2nd International Conference on Networks Security, Wireless Communications and Trusted Computing, vol. 2, pp. 210–214, 2010.
  • [8] S. Naredi and R. A. Deshmukh, “Improved extraction of quantitative rules using Best M Positive Negative Association Rules Algorithm,” 2015 IEEE International Conference on Electronics, Computing and Communication Technologies, CONECCT 2015, pp. 1–5, 2016.
  • [9] X. Piao, Z. Wang, and G. Liu, “Research on mining positive and negative association rules based on dual confidence,” Proceedings - 5th International Conference on Internet Computing for Science and Engineering, ICICSE 2010, pp. 102–105, 2011.
  • [10] W. Ouyang and Q. Huang, “Mining direct and indirect weighted fuzzy association rules in large transaction databases,” 6th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2009, vol. 3, pp. 128–132, 2009.
  • [11] X. S. Xiong, L. Fan, and Z. Lei, “Ontology-Based Association Rule Quality Evaluation Using Information Theory,” in 2010 International Conference on Computational and Information Sciences, 2010, pp. 170–173.
  • [12] M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, and I. H. Witten, “The WEKA data mining software,” ACM SIGKDD Explorations Newsletter, vol. 11, no. 1, p. 10, Nov. 2009.
  • [13] J. Demšar et al., “Orange: Data Mining Toolbox in Python,” Journal of Machine Learning Research, vol. 14, pp. 2349–2353, 2013.
  • [14] H. Bayraktar, “CBS ve Sokak Taraması Yöntemleri Kullanılarak Düzce- Kaynaşlı İlçesinin Afet Riski Yönünden Yerleşim Durumunun Belirlenmesi ve Yerel Afet Risk Yönetimi,” Gazi Üniversitesi, 2014.
  • [15] “QGIS.” [Online]. Available: https://www.qgis.org/en/site/about. [Accessed: July, 15, 2019].
  • [16] İ. B. Aydilek, “Veri Kümelerindeki Eksik Değerlerin Yeni Yaklaşımlar Kullanılarak Hesaplanması,” Selçuk Üniversitesi, 2013.
  • [17] D. Sağaltıcı, F. D. Alay, C. Efil, and N. İlhan, “Veri Madenciliği Yöntemleri İle Meteorolojik Verilerden Kayıp Güneş Işınım Değerlerinin Tahmini,” Harran Üniversitesi Mühendislik Dergisi, vol. 02, pp. 49–53, 2018.
  • [18] F. C. ÖZÇAKIR and A. Y. ÇAMURCU, “Birliktelik Kuralı Yöntemi İçin Bir Veri Madenciliği Yazılımı Tasarımı Ve Uygulaması,” İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, vol. 6, no. 12, pp. 21–37.
  • [19] A. C. GÜLCE, “Veri Madenciliğinde Apriori Algoritması ve Apriori Algoritmasının Farklı Veri Kümelerinde Uygulanması,” Trakya Üniversitesi, 2010.
  • [20] H. SEVER and B. OĞUZ, ““Veritabanlarında Bilgi Keşfine Formal bir Yaklaşım, Kısım 1: Eşleştirme Sorguları ve Algoritmalar,” Bilgi Dünyası, vol. 3, no. 2, 2002.
  • [21] “Validation and Testing accuracy widely different.” [Online]. Available: https://stackoverflow.com/questions/48718663/validation-and-testing-accuracy-widely-different. [Accessed: July, 15, 2019].
  • [22] M. Hahsler, “A Probabilistic Comparison of Commonly Used Interest Measures for Association Rules.” [Online]. Available: https://michael.hahsler.net/research/association_rules/measures.html. [Accessed: July, 15, 2019].
There are 22 citations in total.

Details

Primary Language Turkish
Subjects Computer Software
Journal Section Research Articles
Authors

Levent Sabah 0000-0002-6911-4749

Hüseyin Bayraktar 0000-0001-7277-0838

Publication Date April 30, 2020
Submission Date December 3, 2019
Acceptance Date April 28, 2020
Published in Issue Year 2020 Volume: 6 Issue: 1

Cite

IEEE L. Sabah and H. Bayraktar, “Veri Madenciliği Birliktelik Kuralları Yöntemi Kullanarak Binaların Risk Durumlarının Belirlenmesi”, GJES, vol. 6, no. 1, pp. 70–78, 2020.

Gazi Journal of Engineering Sciences (GJES) publishes open access articles under a Creative Commons Attribution 4.0 International License (CC BY). 1366_2000-copia-2.jpg