In this work, by making use of 10 different web sites having Turkish content, a corpus of
30MB is generated. The number of words used on the web sites that forms this corpus is
calculated, word length distribution of all the corpus is analyzed, and average word length of
Turkish is determined.
Bu çalışmada, Türkçe içeriğe sahip 10 ayrı web sitesinden yararlanılarak, 30MB
büyüklüğünde bir külliyat oluşturulmuştur. Bu külliyatı oluşturan web sitelerinde kullanılan
kelime sayıları hesaplanmış, tüm külliyat için kelime uzunluk dağılımları incelenmiş ve Türkçe’nin ortalama kelime uzunluğu belirlenmiştir.
Other ID | JA85AP86KU |
---|---|
Journal Section | Research Article |
Authors | |
Publication Date | January 1, 2003 |
Published in Issue | Year 2003 Volume: 5 Issue: 1 |
Dokuz Eylül Üniversitesi, Mühendislik Fakültesi Dekanlığı Tınaztepe Yerleşkesi, Adatepe Mah. Doğuş Cad. No: 207-I / 35390 Buca-İZMİR.