XIV. Akademik Bilisim Konferansi

BaşlıkTürkçe Dokümanlar İçin Yazar Tanıma
ÖğrenciHayır
Yazar(lar) Yazar 1
Name: Özcan KOLYİĞİT
Org: Adnan Menderes Üniversitesi
Country: TR
E-mail: okolyigit_AT_gmail.com

Yazar 2
Name: Rıfat AŞLIYAN
Org: Adnan Menderes Üniversitesi
Country: TR
E-mail: rasliyan_AT_adu.edu.tr

Yazar 3
Name: Korhan GÜNEL
Org: Adnan Menderes Üniversitesi
Country: TR
E-mail: kgunel_AT_adu.edu.tr
Diğer Yazar(lar)rasliyan_AT_yahoo.com
Anahtar KelimelerYazar Tanıma, Veri Madenciliği, K-Enyakın Komşu Metodu, Metin Sınıflandırma
ÖzetYazar Tanıma çalışmaları, teknolojinin gelişmesi ve bilginin yaygınlaşması ile ortaya çıkan bir takım sorunlara çözüm üretmek için yapılmaktadır. Bu sorunlardan bazıları yazarı belli olmayan dokümanların yazarlarının belirlenmesi ve yazarının kim olduğundan tam olarak emin olunamayan metinlerin yazarlarının belirlenmesidir. Bu çalışmada Türkçe dokümanlar için yazar tanıma sistemi geliştirilmeye çalışılmıştır. Günlük gazetelerden seçilen 5 yazara ait köşe yazıları kullanılmıştır. Yazarların 70?er yazısından oluşan 350 dokümandan oluşan bir derlem hazırlanmıştır. Bu dokümanlardan 20?şer tanesi eğitim için 50?şer tanesi test için kullanılmıştır. İlk olarak 5 yazara ait dokümanlar toplanmış, daha sonra her yazara ait 20 doküman birleştirilerek tek bir doküman haline getirilmiştir. Bu şekilde elde edilen 5 doküman için sözcük ve gövde öznitelik vektörleri belirlenmiştir. Öznitelik vektörleri belirlenirken her yazar için vektör uzunlukları 20, 30, ve 40 olarak seçilmiş, oluşan öznitelik vektörleri için K-En Yakın Komşu algoritmasıyla test edilmiştir. Sonuç olarak, sözcük ve gövde öznitelik vektörlerine göre ortalama %77 başarı elde edilmiştir.
Başlıklar Veri Madenciliği
Dosya  
 

 

Powered by OpenConf®
Copyright ©2002-2009 Zakon Group LLC