Öneri Özeti
ID | 123 |
Title | DİNAMİK ZAMAN BÜKMESİ YÖNTEMİYLE HECE TABANLI KONUŞMA TANIMA SİSTEMİ |
Author(s) | Author #1 Name: Rıfat Aşlıyan Org: Dokuz Eylül Üniversitesi Country: Türkiye Email: rasliyan__at__yahoo.com Author #2 Author #3
|
Other Author(s) | |
Keywords | Dinamik Zaman Bükmesi, DTW, Konuşma Tanıma, Hece Tabanlı Konuşma Tanıma. |
Abstract | Bu çalışmada, hece tabanlı Türkçe konuşma tanıma sistemi geliştirilmiştir. Türkçe, dünya dilleri arasında yapı yönüyle sondan eklemeli diller grubuna girdiğinden bir sözcükten birçok farklı sözcük türetilebilmesine neden olmaktadır. Bundan dolayı sözcük tabanlı sistem yerine sınırlı sayıda hecelere sahip Türkçe için hece tabanlı sistem tercih edilmiştir. Bu,çalışmamızda, konuşma tanıma sistemlerinde en çok kullanılan yöntemlerden biri olan dinamik zaman bükmesi kullanılmıştır. Sistemin uygulanmasında kullanmak amacıyla imla kılavuzundan birbirine benzer 200 sözcük seçilmiştir. Bu sözcüklerin her biri için 25’er tane wave formatında ses dosyaları kaydedilmiştir. İlk olarak, sözcük ses sinyallerinden hece sınırlarının tespiti algoritmasıyla hecelerin başlangıç ve bitiş sınırları tespit edilmiştir. Daha sonra her hecenin için doğrusal öngörülü kodlama(LPC), parcor, cepstrum ve MFCC öznitelikleri çıkarılmıştır. Bu öznitelikler kullanılarak her hece için bir medyan hece ses sinyali seçilmiştir. Dinamik zaman bükmesi yöntemi kullanılarak benzer sözcükteki hecelere en çok benzeyen medyan heceler sıralı bir şekilde tespit edilir. En çok benzeyen hecelerden 5 tanesi seçilerek tekrar, bu hecelerin bütün ses şablonları arasından tanıma işlemi gerçekleştirilir. Her bir hece için en çok benzeyen 5 hece sıralı bir şekilde tespit edilir. Heceler art arda eklenerek sözcük oluşturulur. Eğer bu sözcük sözlüğümüzde yok ise bir sonraki heceler eklenerek yeni bir sözcük türetilir. Eğer sözlükte var ise tanınan sözcük bu olacaktır. Test işlemi için 2000 tane sözcük kaydedildi ve sistemin mfcc özniteliklerine göre doğru tanıma oranı %93 olmuştur. |
Topics | • Yeni Teknolojiler |
Comments | |
Paper | 123.doc (310KB) |