BibTex RIS Kaynak Göster

Turkish Text to Speech Synthesizer

Yıl 2011, Cilt: 4 Sayı: 1 - Cilt: 4 Sayı: 1, - , 24.06.2016

Öz

The main purpose of this study is development of a "Turkish Text Synthesizer System which converts text, written in Turkish, to human voice. Three different methods are examined for developing this system, these three methods are implemented and their clarity is measured statistically.First, the diphone concatenation method was applied. While the words were understandable, results were far from natural. Thus, considering the reduction of hardware costs in todays conditions the more accepted "syllable concatenation method” was developed. It is statisticaly proven that there is positive improvement with clarity and sound quality with this method. Finally, by changing the amplitude and duration of the sounds, more successful results were obtained for intonation. In order to determine and compare clarity of all methods set sentences were listened by different age groups and their answers were formulated to a score from 0 to 100, and the results were given in a matrix.The Turkish Language Association’s (TDK) database is used to prepare the necessary audio files in the begining of this study. Then, by means of a software program developed, MBROLA library was used to automatically create all the sound files. The amplitude balancing algorithm has been applied to these audio files, and clarity was increased by normalizing the maximum and minimum amplitude differences between sound files.It is provided that, the system has loosely coupled components (text to XML and XML to speech), and using these components a graphical user interface is developed.Finally, a text editing software program is developed to help the visually impaired edit text without the need for a screen image.

Kaynakça

  • Lemmetty S., Review of Speech Synthesis Technology, Helsinki University of Technology, 1999
  • Allen, J., Hunnicutt, S., Klatt D., From Text to Speech: The MITalk System, Cambridge University Press, 1987
  • Dutoit T., A Short Introduction to Text-to-Speech Synthesis http://tcts.fpms.ac.be/synthesis/introtts_old.html, alındığı tarih 25.02.2010
  • http://www.acapela-group.com, alındığı tarih 25.02.2010
  • Ljungqvist M., Lindström A., Gustafson K., A New System for text-to-Speech and Its Applications to Swedish, ICSLP94 (4) : 1779-1782, 1994
  • Mönius B., Schroeter J., Santen J., Sproat R., Olive J., Recent Advances Multilingual Text-to-Speech Synthesis, Fortschritte der Akustik, DAGA, 1995
  • Güldalı K., Türkçe Metin Seslendirme, İstanbul Teknik Üniversitesi, 2009
  • http://www.nuance.com/realspeak, alındığı tarih 26.02.2010
  • Festival Project Homepage http://www.cstr.ed.ac.uk/projects/festival, alındığı tarih 26.02.2010
  • 0] Dutoit T., “An Introduction to Text to Speech Synthesis”, pp 26-32, 1997
  • 1] Wave Dosya Formatı http://ccrma.stanford.edu/courses/422/projects/WaveForm at, alındığı tarih 01.03.2010
  • 2] SAMPA Türkçe, http://www.phon.ucl.ac.uk/home/sampa/turkish.htm, alındığı tarih 07.03.2010
  • 3] Türkçe İmla Kılavuzu - Türk Dil Kurumu, 2000
  • 4] Adalı E., Doğal Dil İşleme, 2010

Türkçe Metin Seslendirme

Yıl 2011, Cilt: 4 Sayı: 1 - Cilt: 4 Sayı: 1, - , 24.06.2016

Öz

Bu çalışmada temel amaç, Türkçe metinlerin insan sesine dönüştürülebilmesi ve “Türkçe Metin Seslendirme” sisteminin geliştirilmesidir. Bu sistem geliştirilirken üç farklı yöntem incelenmiş, uygulanmış ve aralarındaki anlaşılırlık istatistiksel olarak ölçülmüştür. İlk olarak, “çift-ses (diphone) eklemeli yöntem” uygulanmıştır. Anlaşılırlığı düşük olmasa da doğallıktan uzak sonuçlar elde edilmiştir. Bunun üzerine, donanım maliyetinin de azalması ile, çift-ses eklemeye nazaran günümüz koşullarında daha kabul görmüş “hece eklemeli yöntem” geliştirilmiştir. Anlaşılırlık olarak ve ses kalitesinde olumlu yönde fark olduğu istatistiksel olarak ispatlanmıştır. Son olarak, ses süre ve şiddetinin değiştirilmesi suretiyle, vurgu ve tonlamada da başarılı sonuçlar elde edilmiştir. Tüm yöntemlerin ayrı ayrı anlaşılırlığının tespit edilebilmesi ve karşılaştırılabilmesi için; belirlenmiş cümleler, farklı yaş gruplarındaki insanlara dinletilmiş ve alınan cevaplara göre belirli formül yardımı ile yüz üzerinden puan verilecek şekilde hesaplama yapılarak, bir matriste sunulmuştur.Bu çalışmada farklı Türkçe ses sentezleme yöntemleri karşılaştırılmış ve kullanıcı deneyleri ile kalite analizi gerçekleştirilmiştir. Ses sentezleme yöntemlerinin karşılaştırmalı incelenmesi ve yapılarla oynanmasına müsaade edilen bir biçimde sunulması (XML), bu makalenin önemli katkı sağlamış olduğu noktalardır.Tüm çalışmalar için gerekli ses dosyalarının hazırlanması amacıyla önce Türk Dil Kurumunun ses veri tabanı kullanılmıştır. Daha sonra, yazılan program vasıtası ile MBROLA kütüphanelerinin kullanılması ile, tüm ses dosyalarının otomatik olarak oluşturulabilmesi sağlanmıştır. Oluşturulan bu ses dosyalarına, genlik dengeleme algoritması uygulanmış, ses dosyaları arasındaki en fazla ve en az genlik seviye farklılıkları aza indirgenerek anlaşılırlık arttırılmıştır.Hazırlanan programın gevşek bağlaşımlı bileşenlerden (metinden XML geçişi ve XML’den ses oluşturulması) oluşabilmesi sağlanmış ve bu bileşenler kullanılarak kullanıcı arayüzü hazırlanmıştır.Son olarak, görme engellilerin de ekran görüntüsü gerektirmeden kullanabileceği metin düzenleme program hazırlanmıştır.

Kaynakça

  • Lemmetty S., Review of Speech Synthesis Technology, Helsinki University of Technology, 1999
  • Allen, J., Hunnicutt, S., Klatt D., From Text to Speech: The MITalk System, Cambridge University Press, 1987
  • Dutoit T., A Short Introduction to Text-to-Speech Synthesis http://tcts.fpms.ac.be/synthesis/introtts_old.html, alındığı tarih 25.02.2010
  • http://www.acapela-group.com, alındığı tarih 25.02.2010
  • Ljungqvist M., Lindström A., Gustafson K., A New System for text-to-Speech and Its Applications to Swedish, ICSLP94 (4) : 1779-1782, 1994
  • Mönius B., Schroeter J., Santen J., Sproat R., Olive J., Recent Advances Multilingual Text-to-Speech Synthesis, Fortschritte der Akustik, DAGA, 1995
  • Güldalı K., Türkçe Metin Seslendirme, İstanbul Teknik Üniversitesi, 2009
  • http://www.nuance.com/realspeak, alındığı tarih 26.02.2010
  • Festival Project Homepage http://www.cstr.ed.ac.uk/projects/festival, alındığı tarih 26.02.2010
  • 0] Dutoit T., “An Introduction to Text to Speech Synthesis”, pp 26-32, 1997
  • 1] Wave Dosya Formatı http://ccrma.stanford.edu/courses/422/projects/WaveForm at, alındığı tarih 01.03.2010
  • 2] SAMPA Türkçe, http://www.phon.ucl.ac.uk/home/sampa/turkish.htm, alındığı tarih 07.03.2010
  • 3] Türkçe İmla Kılavuzu - Türk Dil Kurumu, 2000
  • 4] Adalı E., Doğal Dil İşleme, 2010
Toplam 14 adet kaynakça vardır.

Ayrıntılar

Diğer ID JA37HP33RG
Bölüm Makaleler(Araştırma)
Yazarlar

Tuncay Şentürk Bu kişi benim

Eşref Adalı

Yayımlanma Tarihi 24 Haziran 2016
Yayımlandığı Sayı Yıl 2011 Cilt: 4 Sayı: 1 - Cilt: 4 Sayı: 1

Kaynak Göster

APA Şentürk, T., & Adalı, E. (2016). Türkçe Metin Seslendirme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 4(1).
AMA Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. Haziran 2016;4(1).
Chicago Şentürk, Tuncay, ve Eşref Adalı. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi 4, sy. 1 (Haziran 2016).
EndNote Şentürk T, Adalı E (01 Haziran 2016) Türkçe Metin Seslendirme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 4 1
IEEE T. Şentürk ve E. Adalı, “Türkçe Metin Seslendirme”, TBV-BBMD, c. 4, sy. 1, 2016.
ISNAD Şentürk, Tuncay - Adalı, Eşref. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 4/1 (Haziran 2016).
JAMA Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. 2016;4.
MLA Şentürk, Tuncay ve Eşref Adalı. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, c. 4, sy. 1, 2016.
Vancouver Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. 2016;4(1).

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.