Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1195
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorGökmen, Muhittin-
dc.contributor.authorTektunalı, Cihan-
dc.date.accessioned2019-11-12T13:42:02Z
dc.date.available2019-11-12T13:42:02Z
dc.date.issued2018-
dc.identifier.citationTektunalı, C. (2018). Pre-ocr ımage optimization by reinforcement learning, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiyeen_US
dc.identifier.urihttps://hdl.handle.net/20.500.11779/1195-
dc.description.abstractOptical Character Recognition technology usage in digital transformation of documents is steadily growing by the help of new hardware and software technologies. However digital image optimization for more accurate OCR results continues to be a problem. In this study, we propose a reinforcement learning based model that learns optimal set of actions to increase OCR accuracy in computer screenshot images. Model input images are identified by their grayscale histogram distributions. An unprocessed base image having 100% OCR accuracy is taken initially. The correlation between the grayscale histograms of base image and input image is used for comparison. We implemented reinforcement learning’s random (or optimal) action and reward approach for creating a Q-table. For measuring image to text conversion success, Tesseract OCR software is used. The introduced approach can improve OCR accuracy especially in bulk image to document conversion jobs. By using optimal actions for single image or bulk images, it can also decrease computational load and time-consumption in image processing.en_US
dc.description.abstractMetinsel dokümanların sayısal ortama aktarılmasında optik karakter tanıma teknolojisinin kullanımı donanım ve yazılım alanındaki gelişmelerin yardımıyla giderek artmaktadır. Bununla birlikte karakter tanımanın daha yüksek başarıyla yapılabilmesi için sayısal görüntü optimizasyonu bir problem olmaya devam etmektedir. Bu çalışmada bilgisayar ekran görüntülerinden karakter tanıma başarısının arttırılması için sayısal görüntü optimizasyonu yapan ve takviyeli öğrenme yöntemini kullanan bir model öne sürülmüştür. Modele girdi olarak verilen sayısal görüntülerin gri ton dağılımları görüntü durumlarını tanımlamak için kullanıldı. Ham haliyle tam başarılı karakter tanıma yapılabilen bir görüntü baz alındı. Verilen yeni görüntüler ile baz alınan görüntünün gri ton dağılımı arasındaki korelasyon değeri görüntüleri karşılaştırmak için kullanıldı. Takviyeli öğrenme ile uygulanan rastgele veya optimal aksiyon dizileri ve sonuç olarak elde edilen ödül değerleri kullanılarak Q-tablosu oluşturuldu. Görüntünün metne çevrilme başarısının ölçümü için Tesseract OCR yazılımı kullanıldı. Oluşturulan bu model ile özellikle sayısal ortama toplu aktarım işlemlerinde karakter tanıma verimi arttırılabilir. Ayrıca görüntü bazında veya tüm görüntü kümesinde optik karakter tanıma iyileştirmesi sağlayacak optimal aksiyonlar kullanılarak toplamdaki hesaplama yükünün ve görüntü işlemede kaybedilen zamanın azaltılması sağlanabilir.en_US
dc.language.isoenen_US
dc.publisherMEF Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectOCR Accuracy Optimizationen_US
dc.subjectReinforcement Learningen_US
dc.subjectQ-table Learningen_US
dc.subjectIncreasing Bulk Image OCR Accuracyen_US
dc.subjectOptik Karakter Tanıma Başarım Optimizasyonuen_US
dc.subjectTakviyeli Öğrenmeen_US
dc.subjectQ-tablosu ile Öğrenmeen_US
dc.subjectÇoklu Görüntülerin Optik Karakter Tanıma Başarımının Arttırılmasıen_US
dc.titlePre-Ocr Image Optimization by Reinforcement Learningen_US
dc.title.alternativeTakviyeli öğrenme ile optik karakter tanıma öncesi görüntü ptimizasyonuen_US
dc.typeMaster's Degree Projecten_US
dc.relation.publicationcategoryYL-Bitirme Projesien_US
dc.departmentBüyük Veri Analitigi Yüksek Lisans Programıen_US
dc.institutionauthorTektunalı, Cihan-
item.grantfulltextopen-
item.fulltextWith Fulltext-
item.languageiso639-1en-
item.openairetypeMaster's Degree Project-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu
Files in This Item:
File Description SizeFormat 
CihanTektunalı.pdfYL-Proje Dosyası676.83 kBAdobe PDFThumbnail
View/Open
Show simple item record



CORE Recommender

Page view(s)

50
checked on Nov 18, 2024

Download(s)

14
checked on Nov 18, 2024

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.