Successive affixation in agglutinative
languages derives complex structures. This study introduces frequency
information of affix sequences in verbal domain from a corpus data. Recurent
patterns of "morphgrams" formed by combinations of voice suffixes
from non-finite template with other verbal inflections from finite template are
extracted from the corpus. Starting with the simple two-morphgram patterns to the
most complex nine-morphgrams, affix sequences are cited in the corpora. Samples
indicate that Turkish do not derive monsterous words but rather limits the number
of affixes that may be attacehed to a verb root or stem. Various statistical calculations
also indicated the significance of grammatical patterns of affixes. The method
and findings of the study have implications for morphological processing in
agglutinative languages.
Frequency affix order verbal synthesis Turkish National Corpus
Sondan
eklemeli dillerde, birbiri ardına eklenebilen çok sayıda biçimbirim son derece
karmaşık diziler oluşturmaktadır. Derlem-çıkışlı bu çalışma derlem verisinde
saptanan biçimbirim dizilerinin sıklık temelli sayısal bilgisini
betimlemektedir. Dengeli ve temsil yeterliği olan Türkçe Ulusal Derlemi
verisinde açıklaması yapılmış metinler taranarak eylemler üzerine eklenebilen
çekim ve türetim ulamlarının sık ve birlikte kullanımı ile oluşan biçimbirim
dizileri saptanmış ve bunların sayısal dağılımları hesaplanmıştır. Yalın iki
biçimbirimli dizilerden karmaşık dokuz biçimbirimli dizilere kadar oluşan gözlenen
sıklık değerleri yüksek diziler içyapılarını oluşturan ögeler ve sayısal
dağılımları ile sıralanmıştır. Saptanan ve sıklık verisi hesaplanan dizilerin oluşturdukları
sıralamanın istatistiksel değerlendirmesi ayrıca yapılmıştır. Çalışma daha
sonra yapılacak derlem-çıkışlı betimlemeler için yöntem ve sayısal verinin
anlamlıklarının hesaplanmasında yol gösterici olacaktır.
Bölüm | Makaleler |
---|---|
Yazarlar | |
Yayımlanma Tarihi | 15 Temmuz 2016 |
Yayımlandığı Sayı | Yıl 2016 Cilt: 13 Sayı: 2 |