Bmp den Text formata dönüşüm

Başlatan z, 24 Ağustos 2010, 13:11:28

z

Ekranda bir textbox bulunmakta. Bu textbox ın ekran üzerindeki koordinatı, ve fontunun tüm detayları bilinmekte.
Textbox içinde bir şeyler yazılı iken ekran görüntüsü bmp formatında yakalanıyor.

Amacım: Elimizdeki bmp veriden  (textbox içindeki alfanumerik karakterlere ait pixellerden) yola çıkarak textbox içindeki veriyi string bir değişkene atmak istiyorum.

Nasıl bir yol izlemeliyim?



Bana e^st de diyebilirsiniz.   www.cncdesigner.com

mufitsozen

bir OCR kutuphanesi ile imajdan karaktere gecis yapmalisin. .net icin bir suru OCR SDK var, google"lamalisin
Aptalca bir soru yoktur ve hiç kimse soru sormayı bırakana kadar aptal olmaz.

z

Bana e^st de diyebilirsiniz.   www.cncdesigner.com

z

Bana e^st de diyebilirsiniz.   www.cncdesigner.com

mufitsozen

himm, cevabini bildiginiz sorularin sorulacagini dusunememisim. bir daha yapmam (valla)

amac aktivite artirmakmi, yoksa bak ben ne kadar cok sey biliyorum demekmi?
Aptalca bir soru yoktur ve hiç kimse soru sormayı bırakana kadar aptal olmaz.

Maxim

Alıntı yapılan: mufitsozen - 24 Ağustos 2010, 16:05:45
himm, cevabini bildiginiz sorularin sorulacagini dusunememisim. bir daha yapmam (valla)

amac aktivite artirmakmi, yoksa bak ben ne kadar cok sey biliyorum demekmi?

hayır C şıkkı
adam çözümünü bulmuş forumla paylaşıyor !

mufitsozen

Aptalca bir soru yoktur ve hiç kimse soru sormayı bırakana kadar aptal olmaz.

z

@mufitsozen

Neden-sonuç ilişkilerine çok dar bir açıdan bakarsan bu meslekte hiç bir yere varamazsın.

Olaylara daha geniş açıdan bakmaya çalış.




Bana e^st de diyebilirsiniz.   www.cncdesigner.com

mufitsozen

#8
olur -)

Maasallah kim nereye varir gibi konularida biliyorsunuz.

Ama belkide meslegimde sizin tahayyul bile edemiyeceginiz yerlere vardim, yasadim vede  gordumde geri geliyorum kim bilir :-) (tabii Yuce Rabbim)

Hocam saat 3 kusurda bir mesaj yazmissin ben iki saat sonra bir cevap vermisim, sende 14 dk sonra tamam buldum demissin.

benim yazdiklarimdan sonra bulduysan, evet biraz search edince buldum gibi bir ifade kullanirdin diye dusunuyorum, o zamanda eskilerimizin bize verdigi nezaket icabi yahu iyiki bu forum var hemen sorunumu cozdum filan yazmak hos olurdu diyorum.

halbuki sen bir ogretmen edasi ile ahada cevap budur demissin.

belkide haklisin hocam, ben acimi daha genis tutmayi ogreneyim, forumdaki sorulara sazan gibi atlamiyayim, 2-3 gun bekleyip oyle cevap yazayim..

kusura bakma. su mubarek Ramazan gunude canini siktiysam ozur dilerim.

saglicakla kal.
Aptalca bir soru yoktur ve hiç kimse soru sormayı bırakana kadar aptal olmaz.

z

Dert etme. Yazdıklarından alınmadım. Gelip geçici kızgınlığım oldu o kadar.

Picproje forum sayfalarını şahsi not defterim gibi kullanıyorum dersem yanlış olmaz.

Şöyleki,

Öncelikle bu formun eski üyelerindenim ve tartışılan konular yıllar geçse de az çok hafızamda kalıyor. Karşılaştığım yeni bir soru yada problemi
genellikle forma yazıyor ardından gelen cevapları bekliyorum. Bu esnada da zamanım varsa web üzerinde araştırmalarımı yapıyorum.

Eğer bir cevap bulursam kendi sorumun hemen altına bulduğum cevabı iliştiriyorum.

Açıkcası ne zaman soru sormuşum ne zaman cevap yazmışım arada kaç dakika geçmiş hiç önemsemiyorum.

Bu soru ve cevabı şahsi bilgisayarımda da kısa notlar şeklinde tutabilirim. Fakat bunun dezavantajı bu veriler kendi makinemde kaybolmaya mahkum olur
ve gorsel olarak formdaki güzel görünmez.

Halbuki picprojede zaten backup alınıyor ve arama özellikleri ile konuya kolayca ulaşabiliyorum. Üstelik diğer üyelerin de işine
yarayacak bilgi birikimi oluyor.

Fazla yazıpta puan alma peşimde değilim.

Neyse konumuza geri dönersek;

Verdiğim linkteki algoritma güzel çalışmasına rağmen iki karakterin birbirine dokunmuyor olması gerekiyor. Eğer iki karakter birbirine bağlı ise
iki karakter tek bir karaktermiş gibi algılanıyor haliyle de buna uyan karakter bulunamıyor.

Sonuçta benim işimi görmedi. Ancak felsefe açısından güzel.

Bana e^st de diyebilirsiniz.   www.cncdesigner.com

mufitsozen

bmp den text'e cevirmek istedigin ornegi iletiye koymamissin ama anlattiklarina bakilirsa web crawler'lari engellemek icin yapilmis bmp imajlarini okumak istiyorsun. Ama bu imajlar otomatik olarak cevrilemesin diye ozellikle oyle yapiliyor.

bu tanima uyan ve web sitesinin insanmi robot tarafindanmi erisildigini anlamak icin kullanilan bu teknige CAPTCHA deniyor. wikipediadan daha ayrintili tarihcesini vs bulabilirsin.

CAPTCHA'lari cozebilmek icin ozel bir takim programlar varsada bu su anda MIT CMU gibi universiteler ve YAHOO, GOOGLE gibi sirketler icin bir research konusudur. Yani senin istedigin kadar kolay bir cozum olmayabilir (Eger gercekten CAPTCHA yi otomatik cozmek istiyorsan)

kolay gelsin
Aptalca bir soru yoktur ve hiç kimse soru sormayı bırakana kadar aptal olmaz.

z

Uygulamamı anlatayım.

PC de koşan özel bir yazılım var. Bu yazılım bazı verileri işliyor ve sonuçlar üretip ekranda gösteriyor. Hiç bir şekilde ekrandaki verileri  dosyaya yazmıyor. Bu yazılımı yeni baştan yazmak kolay iş değil.

Bu nedenle programı yeni baştan yazmak yerine yama yazılımlar yaparak sistemde bazı iyileştirme yapmak adına çalışma başlattım. Bu iyileştirme için sözkonusu ekrandaki verileri dosyaya yazdırmam gerekiyor.

Daha sonra da bu veriler üzerinde sorgulama vs yapan bir yazılım geliştireceğim.

Bu aşamada iki çözüm var. İlki üzerine gene bu forumda biraz konuştuk. Programın ekrandaki göstergelerinin (textbox) handle değerleri tespit edilirse içeriği olan verilere erişmek mümkün ancak handle değerlerini kolayca anlamak sanırım zor ve bu yöntemden vazgeçtim.

2.yöntem  ise ekranın tabiri caizse fotografını çekmek. (Bu işlem kolayca yapılabiliyor.)
Geriye bmp den texte geçme sorunu kalıyor.

textboxlardaki bmp veri son derece temiz. (Eğim, leke vs yok üstelik de kullanılan fontun adı ve boyutları da belli. Dolayısı ile OCR sorunu basite indirgenebiliyor.

Daha önce OCR ile ilgilenmedim. İlk kez linkini verdiğim çalışmayı bugün indirip bire bir kullandım.

Sözkonusu program OCR ye giriş açısından çok güzel. Ancak geliştirilmesi gerekiyor.

Tespit ettiğim sorunlar şunlar.

1) Karakterler bir birine dokunmamalı.
2) Kelimeler arasındaki space karakterleri güme gidiyor.
3) P ve R gibi benzer karakterlerde şaşırıyor.

Fakat çözülebilecek sorun bunlar.

Bu örnek programı görmeden önce soruna 2 boyutlu konvolisyonla yaklaşmayı düşünüyordum. Şimdilik örnek yazılımda bahsettiğim üç sorunu çözmekle meşkulüm.
 
Bana e^st de diyebilirsiniz.   www.cncdesigner.com

FullMetal

harflerin boyutları belli olduğuna göre binary görüntüye dönüştürüldükten sonra doğrudan yada özellik çıkarımı yapıldıktan sonra yapay sinir ağlarına uygulanarak karakterler elde edilebilir.

orhanc

i'm doing nothing... Giddy Up  http://www.drorhan.com