With the development and expansion of computer networks day by day and the diversity of software developed, the damage that possible attacks can cause is increasing beyond the predictions. Intrusion Detection Systems (STS/IDS) are one of the effective defense tools against these potential attacks that are constantly increasing and diversifying. The ultimate goal is to train these systems with various artificial intelligence methods, to detect subsequent attacks in real time and to take the necessary precautions. In this study, classical feature selection methods and Frequent Item Set Mining were used in feature selection in a hybrid model, and it was aimed to classify network traffic data for normal and attack by using many machine learning methods, including Logistic Regression, with the final features obtained. The method uses a data set originally containing 85 features to make a decision while making this classification. These attributes are extracted using CICFlowMeter from a PCAP file where network traffic is recorded. The results show that the proposed method in the study classifies more than 225000 records in the data set with a success rate of 97.68%.
Intrusion Detection Systems Frequent Item Set Mining Hybrid Feature Selection Machine Learning Methods
Bilgisayar ağlarının her geçen gün gelişmesi ve genişlemesi ve geliştirilen yazılımların çeşitliliği ile muhtemel saldırıların neden olabileceği zararlar tahminlerin ötesinde artmaktadır. Sızma Tespit Sistemleri (STS/IDS), sürekli artan ve çeşitlenen bu potansiyel saldırılara karşı etkili savunma araçlarından biridir. Asıl amaç, bu sistemleri çeşitli yapay zeka metotlarıyla eğiterek, sonraki saldırıları gerçek zamanlı olarak tespit etmek ve gerekli önlemleri alabilmektir. Bu çalışmada, hibrit bir modelde özellik seçiminde klasik özellik seçimi yöntemleri ve Sık Kullanılan Öğe Kümeleme kullanılmış ve elde edilen son özelliklerle, Lojistik Regresyon da dahil olmak üzere birçok makine öğrenmesi yöntemi kullanılarak ağ trafiği verilerinin normal ve saldırı için sınıflandırılması amaçlanmıştır. Yöntem, bu sınıflandırmayı yaparken özgün olarak 85 özelliği içeren bir veri setini karar vermede kullanmaktadır. Bu özellikler, ağ trafiğinin kaydedildiği bir PCAP dosyasından CICFlowMeter kullanılarak çıkarılmaktadır. Sonuçlar, çalışmada önerilen yöntemin veri setindeki 225000'den fazla kaydı %97,68 başarı oranı ile sınıflandırdığını göstermektedir.
Primary Language | English |
---|---|
Subjects | Machine Learning (Other) |
Journal Section | Research Article |
Authors | |
Early Pub Date | January 18, 2024 |
Publication Date | |
Submission Date | November 6, 2023 |
Acceptance Date | December 25, 2023 |
Published in Issue | Year 2024 EARLY VIEW |
This work is licensed under Creative Commons Attribution-ShareAlike 4.0 International.