XV. Akademik Bilisim Konferansi

BaşlıkVeri Ambarından Veri Madenciliğine
ÖğrenciHayır
Yazar(lar) Yazar 1
Name: Ömer Utku Erzengin
Org: Süleyman Demirel Üniversitesi
Country:
E-mail: omererzengin_AT_sdu.edu.tr

Yazar 2
Name: Emine Çetin Teke
Org: Süleyman Demirel Üniversitesi
Country:
E-mail: eeminecetin_AT_windowslive.com

Yazar 3
Name: Nurzen Üzümcü
Org: Süleyman Demirel Üniversitesi
Country:
E-mail: nurzenuzumcu_AT_gmail.com
Diğer Yazar(lar)ouerzengin_AT_hotmail.com, 532 452 82 94, 246 211 4059
Anahtar Kelimelerveri madenciligi, veri tabaı yönetimi, özgür yazılım
ÖzetVeri Ambarından Veri Madenciliğine 1. Eğitim İçeriği: Mersinde yapılacak olan 16. Akademik Bilişim Konferansında verilmesi düşünülen eğitimde MySQL Server ve PostgreSQL Server üzerindeki verilerin GNU tabanlı Veri madenciliği yazılımlarına nasıl aktarılacağı ve temel birkaç veri madenciliği tekniği anlatılacaktır. Orange, Weka, RapidMiner ve Knime GNU tabanlı yazılımlardır. Bu veri madenciliği yazılımlarının analiz için kullandığı dosya türlerinin birbirlerinden faklılıkları vardır. Örneğin WEKA *.arff (Attribute-Relation File Format) dosyasını kullanırken Orange *.tab (Tab-Delimited) veri dosyası kullanmaktadır. Aynı veri iki farklı dosya türünde ayrı biçimlerde (format) kullanılması gerekmektedir. Bir dosya türü bir platformda (Java, .Net, Phyton) veri tabanı sunucusundan kolay çekilirken diğer bir platformda aynı dosyayı elde etmek bazı sorunlara yol açmaktadır. Bu veri madenciliği yazılımlarının kullandığı veri dosyaları SQL sunucuların üzerinden de çekilebilir. Orange, Weka, RapidMiner ve Knime yazılımlarının geliştirildiği platformlar birbirlerinden farklıdır. Örneğin WEKA Java üzerinde geliştirilirken, Orange Phyton üzerinde geliştirilmektedir. Veri madenciliği yazılımlarının geliştirildiği platformlara bağlı olarak veri tabanı sunucularına ayrı arabirimlerle (IDE,?) bağlanmaktadır. Ayrıca bir yazılım veri tabanı sunucusuna ODBC üzerinden bağlanmaktayken diğer bir yazılım Java arabirimiyle diğer bir yazılım ise Phyton altındaki bir uygulamayla bağlanmaktadır. Yapılacak eğitimde eldeki veri tabanı sunucularıyla veri madenciliği yazılımları arasındaki uyum ve uyumsuzluklar anlatılacaktır. Veri madenciliği uygulaması olarak önceden geliştirilmiş belli bir ölçek için toplanan verilerin MySQL ve PostgreSQL?den çekilmesi anlatılacaktır. Veri madenciliği eğitiminde kullanılacak veri tarafımızdan geliştirilen bir ölçek aracılığıyla toplanmıştır. Eğitimde kullanılacak olan veriyi oluşturan ölçek, ulusal ve uluslar arası alanda kullanılabilecek Tüketici Çevre Bilinç Endeksi çalışmalarına bağlı bir sürecin parçasıdır. Veri tabanı sunucusunda kullanılan Tüketici Çevre Bilinç Endeksi verisine bağlı çalışmalar bazı ulusal ve uluslar arası kongrelerde sunulmuştur. Eğitimde kullanılacak ikinci veri seti ise Borsa İstanbul?dan alınmış bilanço verileri üzerine olacaktır. Borsa İstanbul?da elde edilmiş veri setinin oluşturulmasındaki amaç kredi verilecek riskli ve risksiz firmaları bilanço üzerindeki hesaplamalarla elde edilen oranlara bağlı olarak ayrıştırıp kümelemektir. Bu çalışma aynı zamanda finansal başarısızlığın veri madenciliğiyle belirlenmesi üzerine kuruludur. Yapılacak sunumda veri tabanı sunucularından veriyi veri madenciliği yazılımlarına aktarma sonrasında veri madenciliği kısmında ise yazılımlarla veri filtrelenmesi, verilerin başka biçimlere aktarılması, verilerin gözlem ve değişken bazında birleştirilmesi, veri madenciliği yazılımlarında simülasyon, verinin kesikli ve sürekli hale getirilmesi ve aykırı gözlemlerin bulunmasının teorisiyle pratiği veri madenciliği yazılımlarında karşılaştırılmalı olarak anlatılacaktır. Gerekli vakit kalırsa geçerlik ve güvenirlik çalışmalarının veri madenciliğinde nasıl yapıldığı ve kümeleme analizlerinden belli başlıklar gösterilecektir. 2. Eğitimi Verecek Eğitmenler Kongre yöneticileri tarafında istenirse eğitmenlerin özgeçmişleri ve yaptıkları ulusal-uluslar arası makaleleri gönderilebilir. Yrd. Doç. Dr. Ömer Utku Erzengin temel eğitmendir. Gerekli izinler alınabilirse Emine Çetin Teke (Eğitim-Öğretim Bilim Uzmanı) ve Nurzen Üzümcü (İstatistikçi) veri tabanında kullanılan veriler ve özellikleri anlatılacaktır. Emine Çetin Teke ve Nurzen Üzümcü eğitime katılamazsa eğitimde kullanılacak veri hakkında bilgi kısaca Yrd. Doç. Dr. Ömer Utku Erzengin tarafından verilecektir. Yrd. Doç. Dr. Ömer Utku Erzengin: Veri Tabanı Sunucularından veri çekilmesi, Veri Madenciliği Yazılımları, Yazılımlardaki teorik bilgiler ve pratik uygulamaları. E-mail: ouerzengin@hotmail.com, omererzengin@sdu.edu.tr Cep tel: 532 452 82 94, İş tel: 246 211 4059 Uzman Emine Çetin Teke: Veri tabanlarında kullanılan verinin özellikleri nelerdir. Anket tabanlı sorgulamayla ölçek nasıl geliştirilir. Ölçek geçerlik ve güvenirlik çalışmaları nelerdir ve veri madenciliğiyle ilişkisi nedir. E-mail: eeminecetin@windowslive.com Cep tel: 505 883 05 32, İş tel: 246 211 4253 İstatistikçi Nurzen Üzümcü: Bilançoya bağlı finansal oranlar üzerinde mali başarısızlık nasıl tespit edilir. Veri madenciliğiyle finansal başarısızlık nasıl ortaya çıkarılır. E-mail: nurzenuzumcu@gmail.com Cep tel: 506 265 48 04 3. Eğitim Süresi Eğitim süresi 2 veya 3 yarım günden oluşacaktır. Uzman Eğitmen Emine Çetin Teke ve İstatistikçi Nurzen Üzümcü akademik bilişim konferansına katılabilirlerse veri tabanı sunucusu üzerinde kullanılan veri hakkında detaylı bilgi vereceklerdir. Bu durumda eğitim 3 yarım gün sürecektir. Veri madenciliği eğitiminde süre kullanımı 3 yarım gün veya 1 tam-1 yarım gün şeklinde olabilir. Eğer bu katılım gerçekleşmezse eğitimde kullanılacak veri hakkında bilgi kısaca Yrd. Doç. Dr. Ömer Utku Erzengin tarafından verilecektir. Bu durumda eğitim 2 yarım gün sürecektir. 4. Eğitim Verileceği Zaman Veri Madenciliği eğitimi Akademik Bilişim Konferansından bir gün önce verilmesi planlanmaktadır. Yurt içi konferanslar ve kongreler için üniversiteden alınabilecek izin en fazla bir gün önce başlayabilmektedir. 5. Eğitim Sırasında Kullanılacak Yazılımlar ve Materyal Eğitim sırasında GNU felsefesiyle oluşturulmuş MySQL ve PostreSQL yazılımları veri tabanı sunucusu olarak kullanılacaktır. Veri madenciliği yazılımı olarak da GNU felsefesiyle oluşturulmuş Orange, Weka, RapidMiner ve KNIME yazılımları kullanılacaktır. Eğitimde kullanılacak verinin telif hakkı olduğundan dağıtılması söz konusu değildir. Ücreti karşılanacak olursa katılımcılara sunu çıktıları A4 kâğıda dökümü alınıp dosyalanarak dağıtılacaktır.Şu anda hazırlanmış 150 sayfalık sunum hazırdır.
Başlıklar AB-Kurs
Veri Madenciliği
Dosya
 

 

Powered by OpenConf®
Copyright ©2002-2009 Zakon Group LLC