Akademik Bilişim 2010 - Muğla Üniversitesi

Title Metin Madenciliği ile Benzer Haber Tespiti
Author(s) Author #1
Name : Anıl KARADAĞ
Org : GEBZE YÜKSEK TEKNOLOJİ ENSTİTÜSÜ
Country : Turkey
Email : anil.karadag__at__gmail.com

Author #2
Name : Hidayet TAKÇI
Org : GEBZE YÜKSEK TEKNOLOJİ ENSTİTÜSÜ
Country : Turkey
Email : htakci__at__gmail.com

Other Author(s)
Keywords Metin madenciliği, metin benzerliği, benzer haber tespiti, vektör uzay modeli, kosinüs benzerliği
Abstract Bu çalışmada - içeriğini farklı haber sitelerinin farklı kategorilerinde yer alan haberleri tarayarak elde eden - dinamik içerikli bir haber sitesi için benzer haberleri sınıflandıran bir sistem geliştirilmiştir. Çalışmanın amacı, arama işleminin işlevselliğini arttırmak ve birbiriyle ilişkili haberleri tespit ederek haber arayan okuyucuya daha yararlı bilgiler sunmaktır. Sistemin çalışma prensibi şu şekildedir, önce her habere anahtar kelimelerden (veya etiket) oluşan bir etiket listesi atanır, sonrasında haberlerin etiket listeleri karşılaştırılarak haberler arasındaki benzerlikler değerlendirilir. Etiketler kelime köklerinden meydana getirilmiştir. Kök tespiti için Türkçe dil işleme kütüphanesi Zemberek'ten yararlanılmıştır. Haber benzerliklerinin bulunmasında özellikle ?son dakika? kategorisindeki haberler kullanılmıştır.
Topics • Veri Madenciliği