Text-to-speech synthesis studies enables all kinds of information to be transmitted by voice. Natural language processing studies, performed in order to better understand the structure of natural language and to facilitate computer-human interaction. In this study, the integration of text-to-speech synthesis and natural language processing technologies is examined. According to the literature review, 24 studies included in the research with certain criteria were examined. Approximately 62% of these studies are dissertations and natural language processing techniques were not used directly in any of them. In 10 of the studies, natural language processing techniques were used or other artificial intelligence technologies were used only in the text processing process. 50% of the researchers stated that there are deficiencies in emphasis and intonation, that the improvement of this situation; argues that it is possible with natural language processing. It is suggested that future text-to-speech synthesis studies should be carried out together with natural language processing techniques, that the compilation texts developed for Turkish should be increased in vocabulary and that they should be classified according to their meanings and integrated into speech-to-text synthesis systems.
Metinden konuşma sentezleme çalışmaları dijital ortamdaki her türlü bilginin sesli olarak iletilmesini sağlamaktadır. Doğal dil işleme çalışmaları ise doğal dilin yapısını daha iyi anlamak ve bilgisayar-insan etkileşimini kolaylaştırmak amacıyla yapılmaktadır. Bu çalışmada, metinden konuşma sentezleme ve doğal dil işleme teknolojilerinin entegrasyonu incelenmiştir. Yapılan literatür taramasına göre belirli kriterlerle araştırmaya dâhil edilen 24 çalışma incelenmiştir. Bu çalışmaların yaklaşık %62’si tez çalışmasıdır ve hiçbirinde doğrudan doğal dil işleme teknikleri kullanılmamıştır. Çalışmaların 10’unda ise, sadece metin işleme sürecinde doğal dil işleme teknikleri kullanılmış veya diğer yapay zekâ teknolojilerinden yararlanılmıştır. Araştırmacıların %50’si, vurgu ve tonlamalarda eksiklikler olduğunu, bu durumun iyileştirilmesinin; doğal dil işleme ile mümkün olduğunu savunmaktadır. Gelecekte yapılacak olan metinden konuşma sentezleme çalışmalarının daha verimli ve doğal bir konuşma elde etmek için doğal dil işleme teknikleriyle birlikte yürütülmesi, Türkçe için geliştirilen derleme metinlerinin sözcük dağarcığının artırılması ve anlamlarına göre sınıflandırılarak metinden konuşma sentezleme sistemlerine entegre edilmesi önerilmektedir. Bu öneriler doğrultusunda insan konuşmasına en yakın seslendirme elde edilmiş olacaktır.
Primary Language | Turkish |
---|---|
Subjects | Computer Software |
Journal Section | Review Articles |
Authors | |
Publication Date | March 23, 2022 |
Submission Date | May 20, 2021 |
Acceptance Date | November 1, 2021 |
Published in Issue | Year 2022 |