Paper 153

Generated: Tue Feb 28 17:21:17 2006

prev (152) overview next (154)

153 - TitleTÜRKÇE DOKÜMAN TANIMA SİSTEMLERİNDE KARŞILAŞILAN KARMAŞIK METİN SATIRLARININ TESPİT EDİLMESİ PROBLEMİNİ ORTADAN KALDIRAN BİR GÖRÜNTÜ ANALİZİ YAKLAŞIMI
AuthorsHasan Karal, Karadeniz Teknik Üniversitesi
Emre Uzun, Karadeniz Teknik Üniversitesi
PC MemberNo
Contact personHasan Karal, hasankaral_at_ktu.edu.tr, 04622488832
Main Fields26. İşaret İşleme
Other Main Fields
Abstract + KeywordsÖZET

Günümüzde yazılı dokümanların bilgisayar ortamında analiz edilmesi ve içeriğindeki metin bilgisinin elde belirlenmesi oldukça geniş bir kullanım alanına sahiptir. Bu tür sistemlere Doküman Tanıma Sistemleri adı verilmektedir. Bu amaçla kullanılan yazılım yöntemleri, her türden yazılı dokümana uygulanabilirlik açısından sınırlılıklar taşımaktadır.

Başlıca soru, doküman resmi üzerindeki metin olarak yorumlanacak kısımların uygun biçimde elde edilememesinden veya metnin orijinalde karmaşık olmasından kaynaklanır. Bu çalışmada, geliştirilen yorumlama tekniği sayesinde, görüntü üzerindeki metinde, karmaşık dahi olsa kendisini oluşturan satırlar tespit edilebilmiş ve yine tespit edilen her metin satırı görüntüsü, üzerinde uygulanan istatistiki hesaplamalar neticesinde kelime ve karakterlere doğru biçimde ayrılabilmiştir. Dokümanlar üzerindeki işlemleri ve sonuçları gerçekleştiren yazılım tarafımızdan C++ Builder yazılım geliştirme ortamı kullanılarak tasarlanmış ve uygulanmıştır. Yazılım, üzerine inşa edilecek ve tespit edilen karakterler üzerinde etkili bir özellik çıkartma yöntemi kullanarak, karakterleri, resimden analiz edilen metin, satır, cümle ve kelime yapısına uygun biçimde düzenlenebilir sayısal metne dönüştürecek bir yapay sinir ağı sistemi, sonraki adımda gerçekleştirilecektir. Çalışmamızda doküman resminin analiz ve görsel biçim değerlendirmesi yapılmış, karşılaşılan problemler geliştirilen algoritmalar ile çözülmüş ve bu işlem başarı ile gerçekleştirilmiştir.

ABSTRACT

Analyzing written document having a wide range of use at computer environment and obtaining information on it is a needed technology nowadays. We say these systems Document Recognition System. Software development methods that are used for this purpose have limited properties in terms of usability.
Main problem is related with not to interpret parts of the document that has needed characters and having complex text document. With the help of interpretation technique that was developed at this study, on the documented text, lines were determined although they are complex and every determined documented text line were separated to word and characters with the help of statistical calculations. Software that makes processes on document and interpreting the results was developed and applied using C++ Builder software development environment. Adding new features to existing software, an Artificial Neural Network converting text on the picture, lines and sentences to digital text will be developed. At this study, documented picture were analyzed and visual concept of the documented picture were evaluated, problems were solved with the developed algorithms and process is successfully completed.

Anahtar Kelimeler: Doküman tanıma sistemleri, görüntü işleme, sinyal işleme, yapay sinir ağları
Remarks

prev (152) overview next (154)

CyberChair Author: Richard van de Stadt  (Borbala Online Conference Services) Development supported by TRESE Copyright © by University of Twente