| Başlık | Türkçe Dokümanlar İçin Yazar Tanıma |
| Öğrenci | Hayır |
| Yazar(lar) |
Yazar 1 Name: Özcan KOLYİĞİT Org: Adnan Menderes Üniversitesi Country: TR E-mail: okolyigit_AT_gmail.com Yazar 2 Name: Rıfat AŞLIYAN Org: Adnan Menderes Üniversitesi Country: TR E-mail: rasliyan_AT_adu.edu.tr Yazar 3 Name: Korhan GÜNEL Org: Adnan Menderes Üniversitesi Country: TR E-mail: kgunel_AT_adu.edu.tr |
| Diğer Yazar(lar) | rasliyan_AT_yahoo.com |
| Anahtar Kelimeler | Yazar Tanıma, Veri Madenciliği, K-Enyakın Komşu Metodu, Metin Sınıflandırma |
| Özet | Yazar Tanıma çalışmaları, teknolojinin gelişmesi ve bilginin yaygınlaşması ile ortaya çıkan bir takım sorunlara çözüm üretmek için yapılmaktadır. Bu sorunlardan bazıları yazarı belli olmayan dokümanların yazarlarının belirlenmesi ve yazarının kim olduğundan tam olarak emin olunamayan metinlerin yazarlarının belirlenmesidir. Bu çalışmada Türkçe dokümanlar için yazar tanıma sistemi geliştirilmeye çalışılmıştır. Günlük gazetelerden seçilen 5 yazara ait köşe yazıları kullanılmıştır. Yazarların 70?er yazısından oluşan 350 dokümandan oluşan bir derlem hazırlanmıştır. Bu dokümanlardan 20?şer tanesi eğitim için 50?şer tanesi test için kullanılmıştır. İlk olarak 5 yazara ait dokümanlar toplanmış, daha sonra her yazara ait 20 doküman birleştirilerek tek bir doküman haline getirilmiştir. Bu şekilde elde edilen 5 doküman için sözcük ve gövde öznitelik vektörleri belirlenmiştir. Öznitelik vektörleri belirlenirken her yazar için vektör uzunlukları 20, 30, ve 40 olarak seçilmiş, oluşan öznitelik vektörleri için K-En Yakın Komşu algoritmasıyla test edilmiştir. Sonuç olarak, sözcük ve gövde öznitelik vektörlerine göre ortalama %77 başarı elde edilmiştir. |
| Başlıklar | Veri Madenciliği |
| Dosya |
|