Open Source Data Mining Programs: A Case Study on R
Year 2018,
Volume:6 No:2 (2018) (Special Issue: IMCOFE 2017), 455 - 468, 06.04.2018
Fatih Kayaalp
,
Muhammet Sinan Başarslan
Abstract
The processes on the way from raw
data to meaningful information is called data mining. The data is processed by
applying various methods of data mining in order to extract hidden information
among raw data. The processed raw data becomes usable in the next steps of data
mining. There are many open source and commercial applications to be used in
data mining and data processing. In this study, information about data mining programs
are given, and a case study on the R program from these programs have been done.
References
- [1] M. Dener, “Açık Kaynak kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
- [2] M. Kaya, S. A. Özel, Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
- [3] Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
- [4] J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
- [5] M.J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
- [6] L.B.Ayre, Data Mining For Information Professionals, June, 2006.
- [7] E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
- [8] Anonymous, R (Programming Language) [Online]. Available: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJvZ3JhbW1pbmdfbGFuZ3VhZ2Up
- [9] P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Available: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
- [10] van Buuren, Stef, et al. Mice Packages, Computer software. Retrieved from: http://cran. r-project. org/web/packages/mice/mice.pdf (2015).
- [11] T. Therneau, B. Atkinson, B. Ripley, Rpart Packages. [Online]. Available: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
- [12] T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, RWeka Packages, [Online]. Available: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
- [13] T. Horthon, A. Zeileis, Partykit Packages, [Online]. Available: https://cran.r-project.org/web/packages/partykit/ partykit.pdf, 2016.
- [14] M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, Caret: Classification and Regression Training, [Online]. Available: https://cran.r-project.org/pub/R/web/packages/caret/caret.pdf, 2016.
- [15] Ş. Özdemir, “Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi”, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016
Açık Kaynak Kodlu Veri Madenciliği Programları: R 'da Örnek Uygulama
Year 2018,
Volume:6 No:2 (2018) (Special Issue: IMCOFE 2017), 455 - 468, 06.04.2018
Fatih Kayaalp
,
Muhammet Sinan Başarslan
Abstract
Ham
verilerden anlamlı bilgilere geçiş sürecine veri madenciliği denir. Veri, ham
veriler arasında gizli bilgileri çıkarmak için çeşitli veri madenciliği
yöntemleri uygulanarak işlenir. İşlenmiş ham veriler, veri madenciliğinin bir
sonraki aşamasında kullanılabilir hale gelir. Veri madenciliği ve veri işlemede
kullanılmak üzere birçok açık kaynak ve ticari uygulama vardır. Bu çalışmada
veri madenciliği programları hakkında bilgi verilmiş ve R programı üzerinde bir
vaka çalışması sunulmuştur. R programı, çeşitli grafiklerle de gösterildiği üzere
kullanıcılar arasında büyük bir tercih oranına sahip olması dolayısıyla
seçilmiştir.
References
- [1] M. Dener, “Açık Kaynak kodlu Veri Madenciliği Programları:WEKA’da Örnek Uygulama” presented at 11th Acad. Inform.Conf., 2009, Şanlıurfa, Turkey, 2009.
- [2] M. Kaya, S. A. Özel, Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması, presented 14th Acad. Inform. Conf., 2014, Mersin, Turkey, 2014.
- [3] Ö. Yalçın, Veri Madenciliği Yöntemleri, 2nd Ed., Papatya Yayıncılık, 2013.
- [4] J. Han, M. Kanber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
- [5] M.J. Berry, G.S. Linoff, Mastering Data Mining, John Wiley&Sons, New York, 2004.
- [6] L.B.Ayre, Data Mining For Information Professionals, June, 2006.
- [7] E. Alpaydın, Zeki Veri Madenciliği: Ham Veridan Altın Bilgiye Ulaşma Yöntemleri, 2000.
- [8] Anonymous, R (Programming Language) [Online]. Available: https://en.0wikipedia.org/index.php?q=aHR0cHM6Ly9lbi53aWtpcGVkaWEub3JnL3dpa2kvUl8ocHJvZ3JhbW1pbmdfbGFuZ3VhZ2Up
- [9] P. Gregory, Top Analytics, Data Science Software – Kdnuggets Software Poll Results, [Online]. Available: https://www.kdnuggets.com/2016/06/r-python-top-analytics-data-mining-data-science-software.html
- [10] van Buuren, Stef, et al. Mice Packages, Computer software. Retrieved from: http://cran. r-project. org/web/packages/mice/mice.pdf (2015).
- [11] T. Therneau, B. Atkinson, B. Ripley, Rpart Packages. [Online]. Available: https://cran.r-project.org/web/packages/rpart/rpart.pdf. 2017.
- [12] T. Hornik, C. Buchta, T. Hothorn, A. Karatzoglou, D. Meyer, A.Zeleis, RWeka Packages, [Online]. Available: https://cran.r-project.org/web/packages/RWeka/RWeka.pdf, 2016.
- [13] T. Horthon, A. Zeileis, Partykit Packages, [Online]. Available: https://cran.r-project.org/web/packages/partykit/ partykit.pdf, 2016.
- [14] M. Kuhn, J. Wing, S. Weston, A. Williams, C. Keefer, A. Engelhardt, C. Candan, Caret: Classification and Regression Training, [Online]. Available: https://cran.r-project.org/pub/R/web/packages/caret/caret.pdf, 2016.
- [15] Ş. Özdemir, “Eğitsel Veri Madenciliği Çalışması: Lise Öğrencilerinin Okula Devamlılık Durumlarının Öngörülmesi”, R ile Veri Madenciliği (Balaban-Kartal), Çağlayan Kitabevi, 2016