Akademik Bilisim 2008

Öneri Özeti

ID123
TitleDİNAMİK ZAMAN BÜKMESİ YÖNTEMİYLE HECE TABANLI KONUŞMA TANIMA SİSTEMİ
Author(s)Author #1
Name: Rıfat Aşlıyan
Org: Dokuz Eylül Üniversitesi
Country: Türkiye
Email: rasliyan__at__yahoo.com

Author #2
Name: Korhan Günel
Org: Adnan Menderes Üniversitesi
Country: Türkiye
Email: kgunel__at__adu.edu.tr

Author #3
Name: Tatyana Yakhno
Org: Dokuz Eylül Üniversitesi
Country: Türkiye
Email: yakhno__at__cs.deu.edu.tr

Other Author(s)
KeywordsDinamik Zaman Bükmesi, DTW, Konuşma Tanıma, Hece Tabanlı Konuşma Tanıma.
AbstractBu çalışmada, hece tabanlı Türkçe konuşma tanıma sistemi geliştirilmiştir. Türkçe, dünya dilleri arasında yapı yönüyle sondan eklemeli diller grubuna girdiğinden bir sözcükten birçok farklı sözcük türetilebilmesine neden olmaktadır. Bundan dolayı sözcük tabanlı sistem yerine sınırlı sayıda hecelere sahip Türkçe için hece tabanlı sistem tercih edilmiştir. Bu,çalışmamızda, konuşma tanıma sistemlerinde en çok kullanılan yöntemlerden biri olan dinamik zaman bükmesi kullanılmıştır. Sistemin uygulanmasında kullanmak amacıyla imla kılavuzundan birbirine benzer 200 sözcük seçilmiştir. Bu sözcüklerin her biri için 25’er tane wave formatında ses dosyaları kaydedilmiştir. İlk olarak, sözcük ses sinyallerinden hece sınırlarının tespiti algoritmasıyla hecelerin başlangıç ve bitiş sınırları tespit edilmiştir. Daha sonra her hecenin için doğrusal öngörülü kodlama(LPC), parcor, cepstrum ve MFCC öznitelikleri çıkarılmıştır. Bu öznitelikler kullanılarak her hece için bir medyan hece ses sinyali seçilmiştir. Dinamik zaman bükmesi yöntemi kullanılarak benzer sözcükteki hecelere en çok benzeyen medyan heceler sıralı bir şekilde tespit edilir. En çok benzeyen hecelerden 5 tanesi seçilerek tekrar, bu hecelerin bütün ses şablonları arasından tanıma işlemi gerçekleştirilir. Her bir hece için en çok benzeyen 5 hece sıralı bir şekilde tespit edilir. Heceler art arda eklenerek sözcük oluşturulur. Eğer bu sözcük sözlüğümüzde yok ise bir sonraki heceler eklenerek yeni bir sözcük türetilir. Eğer sözlükte var ise tanınan sözcük bu olacaktır. Test işlemi için 2000 tane sözcük kaydedildi ve sistemin mfcc özniteliklerine göre doğru tanıma oranı %93 olmuştur.
Topics• Yeni Teknolojiler
Comments
Paper 123.doc (310KB)
 

 

Powered by OpenConf
Copyright ©2002-2006 Zakon Group LLC