Gelişen web ve akıllı mobil teknolojileri ile sosyal medya platformları yaygınlaşmıştır. Son 10 yılda bu platformlardaki aktif kullanıcı sayısının artması veri üretimine de yansımıştır. Sosyal medya platformları aracılığı ile üretilen mekansal veri doğrudan ya da dolaylı kullanımlarla afet yönetimi, pazarlama, politika gibi geniş çerçevede katkılar sunmaktadır. Bu veri geleneksek gönüllü coğrafi bilgi projelerinde üretilen verinin aksine yapılandırılmamış ve çoğunlukla belirli bir amaç için projelendirilmeden üretilen karma bir veridir. Bu nedenle veri üzerinde çalışılacak konuya göre metin analizleri ile filtreleme yapmanın yanında verinin mekansal tarafını ele almak için coğrafi etiketleme ve referanslama konusunda ön işleme yapmayı gerektirmektedir. Bu makalenin amacı, gönüllü coğrafi bilginin bir alt başlığı olan sosyal medya verilerinin mekansal veri olarak kullanımını değerlendirerek, metinlerden coğrafi bilgi çıkarımı yaklaşımlarını tanıtmaktadır. Coğrafi ayrıştırmada ihtiyaç duyulan coğrafya sözlüğü üretimi için bir metodoloji sunmaktadır. Sunulan metodoloji İstanbul ve Londra için üretilen tweetlerde test edilmiş ve ilgi noktalarının tespitinde özellikle bina bazında temsil edilen alanlar için başarı sağlamıştır. Bu çalışma, doğal dilden bağımsız ve coğrafi tekrarlılığa dayalı coğrafi veri elde etme metodolojisi ile literatüre katkı sağlamaktadır.
Sosyal Medya Mekansal Veri Madenciliği Gönüllü Coğrafi Bilgi Coğrafi Ayrıştırma Coğrafya Sözlüğü
İstanbul Teknik Üniversitesi Bilimsel Araştırma Projeleri
MDK-2017-40569 40569
Bu çalışma İstanbul Teknik Üniversitesi Bilimsel Araştırma Projeleri (BAP) programı kapsamında desteklenmiştir (Proje Kodu: MDK-2017-40569 40569).
Social media platforms became widespread thanks to the developments in web and smart mobile technologies. Produced data volume has tremendously increased with the growing number of active users in these platforms in the last decade. Spatial data generated through social media platforms, that is in-/directly produced, contribute to diverse topics such as disaster management, marketing, and policy. This data, unlike the general voluntary geographic information, is unstructured and undirected for a project or for a specific purpose. Therefore, it requires pre-processing and filtering for text analysis according to the subject to be studied, and evaluation for direct or indirect spatial data for geospatial analysis. The aim of this article is to introduce and discuss the use of social media data as a subtitle of voluntary geographic information over geo-parsing approaches. This article also presents a methodology for the production of a gazetteer, which is required for geo-parsing techniques. The proposed methodology in this study is tested with the tweets generated within Istanbul and London areas and it is succeeded especially in the detection of point of interest that is representing the buildings. This study contributes to the literature of geographic data retrieval with the methodology, which is independent of natural language and based on the geographic data repetitiveness.
MDK-2017-40569 40569
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Project Number | MDK-2017-40569 40569 |
Publication Date | May 20, 2020 |
Submission Date | December 30, 2019 |
Published in Issue | Year 2020 Volume: 20 Issue: 2 |