Kā izņemt tekstu no attēliem, izmantojot komandrindu
Tas ir pietiekami vienkārši, lai lasītu attēlu un pats izvelk tekstu. Bet dinamiski velkot tekstu no fotoattēla ir nedaudz grūtāk un par laimi, ieskrūvējiet piedāvā diezgan vienkāršu risinājumu.
Tas komandrindas rīks darbojas Mac, Windows un Linux terminālā. Tajā vienkārši tiek izmantots arguments par attēla failu kopā ar valodu atgriež tekstu kopēts jūsu starpliktuvē.
Jūs varat instalēt visu bibliotēku, izmantojot npm, un tas ir a diezgan vienkārši instalēt. Lieta ir tāda tikai dažas KB lielas un tas nāk ar JS failu, kuru varat pārlūkot GitHub.
Ielīmēt izmanto Tesseract.js bibliotēka attēlu apstrādes automatizēšanai un teksta vilkšanai caur OCR. Tā ir viena no visspēcīgākajām OCR bibliotēkām, un tā ir pilnīgi atvērtā koda, tāpat kā imgclip.
Es domāju, ka esmu visvairāk pārsteigts par šī rīka kvalitāti un ātrumu. Tas patiešām darbojas velciet precīzu tekstu un tas ir viens no vienkāršākajiem rīkiem.
Komandai "imgclip" jābūt darboties tieši terminālī, kam seko relatīvais ceļš uz attēlu. Varat arī pievienot četras iespējas galā, lai pielāgotu izeju.
-h
,--palīdzēt
: izsniedz lietošanas informāciju-V
,--versija
: izvada versijas numuru-l
,--lang
: izdrukā attēla teksta valodu-p
,--drukāt
: izdrukā tekstu attēlā (tā vietā, lai kopētu uz starpliktuvi)
No šī raksta, Tesseract atbalsta 65 valodas vairāk ceļā. Kods, ko pievienojat --lang
tagam jābūt jebkuram kodam, kas tiek izmantots Tesseract failos.
Piemēram, -es eng
meklēs attēlu Angļu valodas teksts, kamēr -l jpn
meklēs Japāņu teksts un jūs pat varat palaist -l jpn_vert
meklēt vertikāli orientēts japāņu teksts.
Tā kā imgclip lielā mērā ir atkarīga no Tesseract, jums būtībā ir visas bibliotēkas iespējas.
Uz sāc, apmeklējiet GitHub lapu un lejupielādējiet kopiju lokāli vai instalējiet to noteiktā direktorijā, izmantojot npm. Tad jūs varat palaist rīku terminālī, piemēram, uz lietojumprogrammu analizēt jebkuru vajadzīgo attēlu.
Redzēt imgclip darbībā, pārbaudiet šo īso videoklipu, kas izveidots kā imgclip demo.