XVII. Akademik Bilisim Konferansi

BaşlıkMetin Sınıflandırmada Benzerlik Hesaplama Tekniklerinin Değerlendirilmesi
ÖğrenciHayır
Yazar(lar) Yazar 1
Name: Mehmet Fatih KARACA
Org: Gaziosmanpaşa Üniversitesi
Country: TR
E-mail: mehmetfatih.karaca_AT_gop.edu.tr

Yazar 2
Name: Mustafa GÜNEL
Org: Gaziosmanpaşa Üniversitesi
Country: TR
E-mail: mustafa.gunel0013_AT_gop.edu.tr

Yazar 3
Name: Akif Alkan TAŞTAN
Org: Gaziosmanpaşa Üniversitesi
Country: TR
E-mail: akifalkan.tastan4413_AT_gop.edu.tr
Anahtar KelimelerVeri madenciliği, metin madenciliği, metin sınıflandırma, benzerlik ölçümü
ÖzetTeknolojik gelişmeler bilgisayar kullanımını ve dolayısıyla bilginin yayılmasını arttırmıştır. Bu durum, veri miktarında oldukça büyük artışlara neden olmuştur. Büyük boyutlardaki verilerin manuel yöntemlerle analiz edilmesi pek mümkün olmamaktadır. Veri boyutunun artmasının sebebi olan bilgisayar, bu verileri işlemek için de kullanılmaktadır. Veri madenciliği, eldeki veriler kullanılarak yeni bilgiler çıkarma işlemidir. Dijital ortamdaki veriler içerisinde metinsel veriler bulunmaktadır. Metin madenciliği, yapısal olmayan bu verilerin madencilik işlemlerinde kullanılmak üzere yapısal veri haline dönüştürülmesi için kullanılmaktadır. Bu çalışmada, internet gazetelerindeki köşe yazılarının sınıflandırılmasında kNN algoritması ile 15 farklı benzerlik hesaplama tekniği uygulanmıştır. Bu tekniklerin elde ettiği sonuçlar hem başarı hem de işlem süresi olarak incelenmiş olup 5 teknikte %100 doğrulukla sınıflandırma gerçekleştirildiği görülmüştür.
Başlıklar AB-Bildiri
Veri Madenciliği
Dosya  
 

 

Powered by OpenConf®
Copyright ©2002-2014 Zakon Group LLC