Tesseract.js Browsers nodrošina attēla OCR tulkojumu

OCR tulkojums joprojām nav ideāls, bet pēdējos gados tas ir ievērojami uzlabojies. Ceļš ir Tesseract tulkošanas dzinējs pašlaik ir atvērts C++.

Lai gan tā ir neticama bibliotēka, tā tomēr attiecas tikai uz programmatūru. Par laimi kāds ir izveidojis Tesseract ostu JavaScript, ko sauc par Tesseract.js. Tā atbalsta līdz 60 valodām un, lai gan tas noteikti nav perfekts, tas strādā labi.

Uzstādīšana un uzstādīšana ir brīze, kur var mērķēt jebkuru attēla elementu lapā un palaist Tesseract.recognize () funkciju. Tas var aizņemt jebkura veida attēlu, un tas tiks automātiski saspiest un tulkot tieši pārlūkprogrammā.

Jūs varat iegūt daudz sarežģītāku, bet skaistums ir kā jūs varat palaist OCR ar vienu kodu.

Skatiet Tesseract.js galamērķa lapu, ja vēlaties redzēt tiešraidē demonstrētu. Tas darbojas tieši pārlūkā, kur jūs varat velciet un nometiet jebkuru skenēto teksta attēlu, lai iegūtu automātisku OCR tulkojumu.

Šo piemēru varat lejupielādēt arī lokāli, izmantojot GitHub lapu, vai arī varat izveidot savu lietotni, iekļaujot Tesseract.js skriptu tieši no CDN.

Vienkāršākais koda piemērs izskatās šādi myImage ir tieša atsauce uz HTML attēla elementu:

 Tesseract.recognize (myImage) .lv (funkcija (rezultāts) console.log (rezultāts));

Katrā ziņā šī bibliotēka ir tik noderīga, lai varētu pārvietoties ar OCR tīmeklī. Tas ir tālu no perfekta, bet tas ir arī labākais resurss tīmekļa izstrādātājiem, kas vēlas dinamisku lapas OCR funkcionalitāti.

Lai uzzinātu vairāk, apmeklējiet lapu Tesseract.js GitHub, kurā varat apskatīt tiešraidi un pārlūkot tiešsaistes dokumentāciju.