3-da Aaladaha OCR ee khadka tooska ah ee ugu Wanaagsan ee Laga Soo Saaro Qoraalka Sawirada

Ka-soo-celinta qoraalka sawirada waxay noqon kartaa xanuun dhab ah. Marka qoraalka loo soo bandhigo muuqaal ahaan ama qaab kale oo aan la dooran karin, dugsiga iyo shaqadu way adkaadaan. Xalka kaliya ayaa ah in indhaha iyo farahaas la shaqaysiiyo oo la helo in la qoro-mise waa?

Aqoonsiga Dabeecada(Character Recognition) ugu Fiican , ama OCR , waa habka loogu beddelo qoraalka farta lagu fiiqay ama gacanta lagu qoray ee warbaahinta sida dukumeenti la sawiray ama sawiro qoraal cad.

In kasta oo ay ku xidhan tahay khaladaad, iyadoo ku xidhan caddaynta qoraalka, adeegsiga OCR si aad qoraal uga soo saarto sawirrada waxay kaa badbaadin kartaa saacado shaqo keli ah. Hal kiis oo OCR ah oo la isticmaalo ayaa noqon doona haddii aad tahay arday jaamacadeed oo u baahan bog gaar ah oo ka baxsan buugga waxbarashada. Haddii saaxiib uu kuu soo diro sawirka bogga, waxaad isticmaali kartaa OCR si aad u soo saarto dhammaan qoraalka sawirka si aad si fudud u akhrido oo aad nuqul u sameyso.

Maqaalkan, aan ku sahamiyo saddex ka mid ah aaladaha OCR ee ugu wanaagsan khadka si aan uga soo saarno qoraalka sawirada, midkoodna uma baahna barnaamij OCR ah(OCR software) ama plugins si loo soo dejiyo.

OnlineOCR

OnlineOCR waa mid ka mid ah siyaabaha ugu fudud uguna dhaqsaha badan ee loogu beddelo sawirka ama faylka PDF qaabab qoraal oo kala duwan.

Koonto la'aan, OnlineOCR.net waxay kuu oggolaaneysaa inaad u beddesho illaa 15 fayl qoraal saacaddii. Diiwaan gelinta akoonku waxay ku siinaysaa fursad aad ku hesho astaamo ay ka mid yihiin beddelka dukumeenti PDF bogag badan ah iyo in ka badan.

OnlineOCR.net waxay taageertaa ka beddelashada qaababka PDF , JPG , BMP , TIFF , iyo GIF , una soo saarta sida DOCX , XLSX , ama TXT .

OnlineOCR.net waxay aqoonsan kartaa qoraalka , Af Ingiriisida(English) , Afrikaans , Albaniyan(Albanian) , Basque , Brazilian , Bulgaariya(Bulgarian) , Catalan , Shiinees(Chinese) , Croatian , Czech , Danish , Dutch , Espanto(Esperanto) , Istooniyaan(Estonian) , Finish(Finnish) , Faransiis(French) , Galician , Jarmal(German) , Giriiga(Greek) , Hungarian , Icelandic , Indonesian , Talyaani(Italian), Jabbaan(Japanese) , Kuuriyaan(Korean) , Laatiinka(Latin) , Latvia(Latvian) , Lithuania(Lithuanian) , Macedonia(Macedonian) , Malaay(Malay) , Moldaviyan(Moldavian) , Noorway(Norwegian) , Polish , Boortaqiis(Portuguese) , Roomaaniyaan(Romanian) , Ruush(Russian) , Seerbiya(Serbian) , Slovakia(Slovak) , Slovenian , Isbaanish(Spanish) , Iswidhish(Swedish) , Tagalog , Turkish , iyo Yukreeniyaan.

Habka beddelka wuxuu u baahan yahay saddex tallaabo oo fudud. Waxaad soo rogtaa fayl, ku xaraysan 15 MB, dooro luqadaada iyo qaabka wax soo saarka, oo guji badhanka Beddelka(Convert) .

Iyadoo aan loo eegin qaabka wax soo saarka ee aad doorato, horudhac qoraal oo cad oo beddelaad ah ayaa ka muuqan doona goobta ka hooseysa xiriirka si aad u soo dejiso faylka qaabka aad dooratay. Tani waxay ka hortagtaa isticmaalayaasha inay ku lumiyaan soo dejinta soo saarista laga yaabo inay khaldan tahay.

NewOCR

NewOCR waxay hadda bixisaa ka saarista qoraalka faylalka sawirka, laakiin waxay taageertaa sifooyin kale oo xiiso leh oo badan oo bixiyayaasha OCR ee khadka tooska ah aysan samayn.

Si aad u bilowdo isticmaalka NewOCR , si fudud guji badhanka Dooro File(Choose File) , dooro sawirka aad rabto inaad ka soo saarto qoraalka, ka dibna dhagsii badhanka buluuga ah ee Horudhac(Preview) . Tani waxay markaas soo qaadan doontaa horudhac sawirkaaga oo waxay soo bandhigaysaa dhawr ikhtiyaar oo dheeraad ah.

Si ka duwan inta baddan kuwa kale ee sawir-ku-beddelayaasha qoraalka ah, NewOCR waxay dhab ahaantii kuu oggolaan doontaa inaad dejiso luqado badan oo aqoonsi ah. Tani waxay noqon kartaa mid aad waxtar u leh haddii aadan hubin luqadda qoraalka ku jira sawirka uu ku qoran yahay, laakiin aad leedahay malo wanaagsan oo aad rabto inaad ka hesho turjumaad habboon qoraalkiisa cad.

Haddii sawirkaagu hal dhinac u leexiyo, waxa kale oo aad si firfircoon u beddeli kartaa. Marka aad codsato fursadaha lagama maarmaanka ah, waxaad riixi kartaa badhanka buluuga ah ee OCR si aad u soo saarto qoraalka sawirka.

Halkan, waxaad kala soo bixi kartaa qoraalka la soo saaray oo ah TXT , DOC , ama qaab PDF ah, ama si toos ah ugu dir Google Translate ama Google Docs si aad u tafatirto dheeraad ah.

OCR.space

Ugu dambeyntii, OCR.space dhab ahaantii waa mid ka mid ah fursadaha ugu adag ee aan helnay, waana in ay kugu daboolaan wax ku saabsan hawlgal kasta oo sawir-ka-qoraalka ah.

OCR.space waa mid ka mid ah qalabka OCR ee ugu fiican ee taageera qaabka faylka WEBP . Marka laga reebo taas, PNG , JPG , iyo PDF sidoo kale waa la taageerayaa. Intaa waxaa dheer, uma baahnid inaad fayl geliso - meel fog ayaad ku xidhi kartaa haddii uu ka jiro meel onlayn ah.

Astaamaha kale ee niche waxa ka mid ah is-wareejin(auto-rotation) , iskaanka rasiidka(receipt scanning) , aqoonsiga miiska(table recognition) , iyo is miisaanaynta(auto-scaling) . OCR .space waa mid ka mid ah aaladaha OCR ee khadka tooska ah ee taageera soo saarista faylasha sida PDFs la raadin karo(searchable PDFs) (oo leh qoraal la arki karo ama aan la arki karin), oo waxaad xitaa dooran kartaa mid ka mid ah labada matoorada OCR(OCR engines) ee kala duwan sida ugu wanaagsan ee suurtogalka ah.

Waxa kaliya ee ay tahay inaad sameyso waa raritaanka ama isku xirka faylka, dhagsii Start OCR!badhanka, ka dibna horudhac natiijooyinkaaga ayaa si firfircooni leh ugu soo shubmi doona isla bogga. Haddii aad u dooratay wax-soo-saarkaaga sidii PDF la raadin karo , soo dejinta(Download) iyo tusaha(Show Overlay) badhamada ayaa sidoo kale diyaar noqon doona.

Mid ka mid ah astaamaha ugu xiisaha badan uguna gaarka ah OCR.space waa inay soo saari karto soo saaristaada JSON ahaan . JSON -kan waxa uu lahaan doona goobo ay ku jiraan kelmad kasta oo qoraalka ku jirta iyo isku-duwayaashooda sawirka laftiisa. Tani waa sifada aad loo mahadiyay haddii aad tahay cod-bixiye halkaa jooga oo isku dayaya in aad barnaamij ahaan qoraal ka soo saartid sawirada(extract text from images) .

Saddexda aaladaha shabakadda ee kor ku xusan, ka soo saarista qoraalka ka soo saarista sawir kasta oo cad oo la fahmi karo waa inay noqotaa gabal keega ah. Xitaa haddii aad tahay qof si degdeg ah wax u qori kara oo leh kormeerayaal badan, looma baahnid inaad ku dhibto adiga oo qoraal qoraal ah laftaada ah. OCR waxaa loo sameeyay sabab, oo shabakadahaan waxay kaa caawinayaan inaad sida ugu fiican uga faa'iidaysato!

Haddii aad hayso wax tilmaan ah oo ku saabsan qalabka ama adeegyada OCR ee ugu fiican ee aad jeclaan lahayd inaad la wadaagto, ama aad jeclaan lahayd in lagaa caawiyo isticmaalka mid ka mid ah kuwa sare, xor ayaad u tahay inaad noogu soo riddo farriin faallooyinka hoose.



About the author

Waxaan ahay barnaamij kombuyuutar oo ku takhasusay horumarinta software-ka MacOS. Waxaan u adeegsadaa xirfadahayga si aan u qoro faallooyin xirfadeed oo aan ku siiyo talooyin ku saabsan sida loo horumariyo xirfadahaaga barnaamij ee Mac-ka. Waxa kale oo aan haystaa shabakad bixisa tifaftiran, tilmaamo tallaabo-tallaabo ah oo lagu abuurayo degel guul leh.



Related posts