Özet
Metinden konusma sentezleme; yazılı bir metnin gelistirilen sistem tarafından otomatik olarak okunmasıdır. Bu çalısmada, difon tabanlı, eklemeli bir konusma sentezleyici tasarlanmıs ve gerçeklestirilmistir. Birlestirmede PSOLA yöntemi kullanılmaktadır. Genellikle konusma sentezleyicilerin ezgi modeli yoktur veya eksiktir. Bu durum sentezlenen konusmanın dogallıgını olumsuz yönde etkiler. Çalısmamızda bu eksikligin giderilmesi için yeni bir model önerilmistir. Sentezlenen konusmanın dogallıgının artırılması için, konusmanın ezgisi üzerinde süre ve vurgu temelli kurallar tanımlanmıstır. Bu kurallar, hazırlanan ara yüzde yapılan pek çok denemenin sonucunda bulunmustur. Uygulanan kuralların sentezlerin dogallıgındaki basarısı öznel dinleme testleriyle ölçülmüstür. Sonuç olarak, tanımlanan kuralların gelistirilen konusma sentezleyicide uygulanması ile CMOS testi sonucunda 1,86/5,00 puanlık bir artıs elde edilmistir. Bu sonuç, ezgi modelimizin basarılı oldugunu göstermektedir.
Abstract
Text to speech synthesis (TTS) is the automatic reading of a text by a system. In this work, a TTS system which concatenates diphones has been designed and implemented. For concatenations, PSOLA method was used. Usually speech synthesizers lack an intonation model. This degrades the naturalness of the synthesized speech. For increasing the naturalness of the synthesized speech, duration and accent based rules were defined in this study for a proper intonation. These rules were determined after an extensive set of experiments performed in the designed testbed. In the end, an improvement of 1.86/5.00 in the CMOS score was obtained by applying the defined rules in the developed synthesis platform. This result shows the success of our intonation model.
Metinden konusma sentezleme difon PSOLA ezgi modeli dogallık CMOS Text to speech synthesis (TTS) diphone intonation model naturalnes
Birincil Dil | Türkçe |
---|---|
Bölüm | Akademik ve/veya teknolojik bilimsel makale |
Yazarlar | |
Yayımlanma Tarihi | 1 Aralık 2011 |
Gönderilme Tarihi | 9 Ekim 2012 |
Yayımlandığı Sayı | Yıl 2011 Cilt: 1 Sayı: 2 |
EMO BİLİMSEL DERGİ
Elektrik, Elektronik, Bilgisayar, Biyomedikal, Kontrol Mühendisliği Bilimsel Hakemli Dergisi
TMMOB ELEKTRİK MÜHENDİSLERİ ODASI
IHLAMUR SOKAK NO:10 KIZILAY/ANKARA
TEL: +90 (312) 425 32 72 (PBX) - FAKS: +90 (312) 417 38 18
bilimseldergi@emo.org.tr