Büyük Veri Yaklaşımıyla Birden Çok Bilgi Erişim Merkezinin Kolektif Kullanımı
Year 2018,
, 123 - 129, 30.04.2018
Hidayet Takcı
,
Nuriye Aydemir
Abstract
Gelişen bilgisayar sistemleri üretilen veri miktarını artırırken değerli
veriye erişimi daha zorlu hale getirmiştir. Kullanıcıların yerel veri
tabanlarında kayıtlı bibliyografik verileri kullanarak katalog taraması yapması
modası geçmek üzere olan bir yöntemdir. Bu sorunun çözümü için hem
bibliyografik veri kaynakları artırılmalı hem de daha performansı yüksek
yöntemlerle tarama yapılabilmelidir. Veri kaynaklarını artırmada bir yöntem
bilgi erişim merkezlerinin konsorsiyum mantığında bir araya getirilmesidir.
Yüksek performanslı tarama için ise yöntem bibliyografik verilerin özetlenmesi
ve dağıtılmasıdır. Bugüne kadar teknik nedenlerle mümkün olmayan bu türden bir
yaklaşım büyük veri yardımıyla mümkün olabilecektir. Bu çalışma; bilgi erişim
merkezi kaynaklarının özetlendiği ve paylaşıldığı bir mimari önerir. Bu
yaklaşıma göre her bir bilgi erişim merkezinin bibliyografik verisi Hadoop
mimarisinde dağıtık olarak bir veri düğümü ile, bütün bilgi erişim
merkezlerinin özet verisini tutan ana merkez ise bir isim düğümü ile
eşleştirilecektir. Veri düğümlerinde bibliyografik veri, isim düğümünde ise bilgi
erişim merkezi bilgileri ve karakter n-gramlara dayalı özetler yer alacaktır. Sistemden
yararlanmak isteyen bir kullanıcı önce isim düğümü üzerinde sorgulamasını
yapacak sorgusu ile en iyi eşleşen veri düğümünü bulacak ve daha sonra veri
düğümü üzerinde detay sorgusunu yapabilecektir. Bu çalışma kapsamında kişilerin
eskiden beri kullandığı bilgi erişim yöntemleri büyük veri yaklaşımıyla
modernize edilmiş olup ortaya bir öneri konmuştur.
References
- [1] Bozkurt, A. (2016). Öğrenme analitiği: e-öğrenme, büyük veri ve bireyselleştirilmiş öğrenme. Açık Öğretim Uygulamaları ve Araştırmaları Dergisi (AUAd), 2(4), 55 81. http://www.academia.edu/29648170/Öğrenme_analitiği_e öğrenme_büyük_veri_ve_bireyselleştirilmiş_öğrenme
- [2] İnternet:G. Utkun, Microsoft Türkiye Blog, http://blog.microsoft.com.tr/buyuk-veri-nedir.html, 30.06.2017.
- [3] F. X. Diebold, “Big Data” Dynamic Factor Models for Macroeconomic Measurement and Forecasting, 115-122, 2000.
- [4] V. M. Schönberger, K. Cukier. Büyük Veri - Yaşama, Çalışma ve Düşünme Şeklimizi Dönüştürecek Bir Devrim. Çev. B. Erol, Paloma Yayınları, İstanbul, 2013.
- [5] İnternet: C. Göksu, Datawarehouse Türkiye, http://datawarehouse.gen.tr/big-datanedir-geleneksel-veri-yonetimine-etkisi-ne-olur, 30.06.2017.
- [6] B. Hoy, “Big data: An introduction for librarians”. Medical Reference Services Quarterly, 33(3): 320-326, 2014.
- [7] D. M. Schaeffer, P. C. Olson, “Big data options for small and medium enterprises”. Review of Business Information Systems. 18 (1): 41-46, 2014.
- [8] E. Dumbill, “Making sense of big data”. Big Data: 1-2, 2013.
- [9] S. Nicholson, Bibliomining for automated collection development in a digital library setting: Using data mining to discover web-based scholarly research works. Journal of the American Society for Information Science and Technology 54(12). 1081-1090, 2003.
- [10] R. K. Dwıvedı, R. P. Bajpaı, “Data Mınıng Technıques For Dynamıcally Classıfyıng And Analyzıng Lıbrary Database”, 5th International CALIBER -2007, Panjab University, Chandigarh, 08-10 February, 2007.
- [11] H. Takçı, İ. Soğukpınar, Discovery of Access Patterns of Library Users”, Information World Journal, Volume 3, Issue 1, s 12-26 April 2002.
- [12] H. Takçı, İ. Soğukpınar, Web Kullanıcıların Kümelenmesi ile Nüfuz Tespiti", TBD 21. Ulusal Bilişim Kurultayı, ODTU-Ankara, 4-6 Ekim 2004.
- [13] A. Visa, Technology of Text Mining, P. Perner (Ed.): MLDM 2001, LNAI 2123, pp. 1–11, 2001.
- [14] F. Giunchiglia, U. Kharkevich, I. Zaihrayeu, Concept Search: Semantıcs Enabled Informatıon Retrıeval, Technical Report # DISI-10-004, University of Trento, Janurary 2010.
- [15] W. B. Cavnar, J. M. Trenkle, “N-gram-based text categorization”, Proceedings of SDAIR-94, 3rd Annual Symposium on Document Analysis and Information Retrieval. Information Systems Project Management, Jolyon E. Hallows, AMACOM Pres, 1994.
- [16] F. Peng, V. Keselj, N. Cerconey, C. Thomasy, “N-Gram-Based Author Profiles For Authorship Attribution”, Faculty of Computing Science, Dalhousie University, Canada, 2003.
- [17] E. Miller, D. Shen, J. Liu, C. Nicholas, T. Chen, Techniques for Gigabyte-Scale N gram Based Information Retrieval on Personal Computers, International Conference on Parallel and Distributed Processing Techniques and Applications, Las Vegas, NV, pages 1410-1416, June 1999.
- [18] C. Pearce, E. Miller, The TELLTALE Dynamic Hypertext Environment: Approaches to Scalability, in Advances in Intelligent Hypertext, J. Mayfield and C. Nicholas, eds. Lecture Notes in Computer Science, Springer-Verlag, pages 109 – 130, October 1997.
Year 2018,
, 123 - 129, 30.04.2018
Hidayet Takcı
,
Nuriye Aydemir
References
- [1] Bozkurt, A. (2016). Öğrenme analitiği: e-öğrenme, büyük veri ve bireyselleştirilmiş öğrenme. Açık Öğretim Uygulamaları ve Araştırmaları Dergisi (AUAd), 2(4), 55 81. http://www.academia.edu/29648170/Öğrenme_analitiği_e öğrenme_büyük_veri_ve_bireyselleştirilmiş_öğrenme
- [2] İnternet:G. Utkun, Microsoft Türkiye Blog, http://blog.microsoft.com.tr/buyuk-veri-nedir.html, 30.06.2017.
- [3] F. X. Diebold, “Big Data” Dynamic Factor Models for Macroeconomic Measurement and Forecasting, 115-122, 2000.
- [4] V. M. Schönberger, K. Cukier. Büyük Veri - Yaşama, Çalışma ve Düşünme Şeklimizi Dönüştürecek Bir Devrim. Çev. B. Erol, Paloma Yayınları, İstanbul, 2013.
- [5] İnternet: C. Göksu, Datawarehouse Türkiye, http://datawarehouse.gen.tr/big-datanedir-geleneksel-veri-yonetimine-etkisi-ne-olur, 30.06.2017.
- [6] B. Hoy, “Big data: An introduction for librarians”. Medical Reference Services Quarterly, 33(3): 320-326, 2014.
- [7] D. M. Schaeffer, P. C. Olson, “Big data options for small and medium enterprises”. Review of Business Information Systems. 18 (1): 41-46, 2014.
- [8] E. Dumbill, “Making sense of big data”. Big Data: 1-2, 2013.
- [9] S. Nicholson, Bibliomining for automated collection development in a digital library setting: Using data mining to discover web-based scholarly research works. Journal of the American Society for Information Science and Technology 54(12). 1081-1090, 2003.
- [10] R. K. Dwıvedı, R. P. Bajpaı, “Data Mınıng Technıques For Dynamıcally Classıfyıng And Analyzıng Lıbrary Database”, 5th International CALIBER -2007, Panjab University, Chandigarh, 08-10 February, 2007.
- [11] H. Takçı, İ. Soğukpınar, Discovery of Access Patterns of Library Users”, Information World Journal, Volume 3, Issue 1, s 12-26 April 2002.
- [12] H. Takçı, İ. Soğukpınar, Web Kullanıcıların Kümelenmesi ile Nüfuz Tespiti", TBD 21. Ulusal Bilişim Kurultayı, ODTU-Ankara, 4-6 Ekim 2004.
- [13] A. Visa, Technology of Text Mining, P. Perner (Ed.): MLDM 2001, LNAI 2123, pp. 1–11, 2001.
- [14] F. Giunchiglia, U. Kharkevich, I. Zaihrayeu, Concept Search: Semantıcs Enabled Informatıon Retrıeval, Technical Report # DISI-10-004, University of Trento, Janurary 2010.
- [15] W. B. Cavnar, J. M. Trenkle, “N-gram-based text categorization”, Proceedings of SDAIR-94, 3rd Annual Symposium on Document Analysis and Information Retrieval. Information Systems Project Management, Jolyon E. Hallows, AMACOM Pres, 1994.
- [16] F. Peng, V. Keselj, N. Cerconey, C. Thomasy, “N-Gram-Based Author Profiles For Authorship Attribution”, Faculty of Computing Science, Dalhousie University, Canada, 2003.
- [17] E. Miller, D. Shen, J. Liu, C. Nicholas, T. Chen, Techniques for Gigabyte-Scale N gram Based Information Retrieval on Personal Computers, International Conference on Parallel and Distributed Processing Techniques and Applications, Las Vegas, NV, pages 1410-1416, June 1999.
- [18] C. Pearce, E. Miller, The TELLTALE Dynamic Hypertext Environment: Approaches to Scalability, in Advances in Intelligent Hypertext, J. Mayfield and C. Nicholas, eds. Lecture Notes in Computer Science, Springer-Verlag, pages 109 – 130, October 1997.