Tesseract.js tar bild OCR-översättning till webbläsare

OCR-översättning är fortfarande inte perfekt men det har förbättrats dramatiskt de senaste åren. Ledningen är Tesseract översättningsmotor öppnar för tillfället i C++.

Även om detta är ett otroligt bibliotek, är det dock begränsat till programvara. Lyckligtvis gjorde någon en Tesseract-port till JavaScript som heter Tesseract.js. Det stöder upp till 60 språk och medan det verkligen inte är perfekt, det gör jobbet bra.

Installation och installation är en bris där du kan rikta något bildelement på sidan och köra Tesseract.recognize () fungera. Detta kan ta vilken typ av bild som helst och det kommer automatiskt komprimera och översätta precis i webbläsaren.

Du kan bli mycket mer komplicerad men skönheten är hur du kan köra OCR med en enda kodrad.

Kolla in Tesseract.js målsida om du vill se en live demo. Det fungerar direkt i webbläsaren där du kan dra och släpp alla skannade bilder av text för att få en automatisk OCR-översättning.

Du kan också ladda ner det här exemplet lokalt via GitHub-sidan eller du kan bygga din egen app genom att ta med Tesseract.js-skriptet direkt från en CDN.

Det enklaste kodexemplet ser ut som följande där myImage är en direkt hänvisning till ett HTML-bildelement:

 Tesseract.recognize (myImage) .then (funktion (resultat) console.log (result));

Hur som helst, det här biblioteket är så användbart att du flyttar med OCR på webben. Det är långt ifrån perfekt men det är också bästa resursen för webbutvecklare som vill ha dynamisk OCR-funktionalitet på sidan.

För att lära dig mer, besök Tesseract.js GitHub-sidan där du kan kolla in en levande demo och bläddra igenom dokumentationen online.