A Tesseract telepítése Windows rendszeren

A Tesseract Telepitese Windows Rendszeren



A Tesseract egy szabadon elérhető, nyílt forráskódú szövegfelismerő eszköz, más néven OCR (optikai karakterfelismerés). Elsősorban szöveg azonosítására és képekből való kiemelésére szolgál. Beolvassa a szöveget a képadatokból, és a kimenetet egy új .txt fájlba írja. A Tesseract Python alatt is működik, mivel elsősorban a képekről írt kézírás felismerésére szolgál. Az LSTR (Long short-term memory) modellt használja. A Tesseract Apache 2.0 licenc alatt működik.

Ebben a blogban részletesen bemutatjuk a Tesseract Windows rendszerre történő telepítésének módját.







Szóval, kezdjük!



Hogyan telepíthető a Tesseract Windows rendszerre?

A Tesseract egy parancssori eszköz, amelyet a képek szövegének kinyerésére használnak. A Tesseract Windows rendszerre történő telepítéséhez kövesse az alábbi utasításokat.



1. lépés: Töltse le a Tesseract telepítőt





Először navigáljon az alábbi linkre, és töltse le a Tesseract telepítőt a rendszer specifikációinak megfelelően:

https: // github.com / UB-Mannheim / tesserakt / hét



2. lépés: Futtassa a Tesseract telepítőt

Meglátogatni a ' Letöltések ” könyvtár, ahová a Tesseract telepítő letöltődik. A Tesseract Windows rendszerre történő telepítéséhez hajtsa végre a Tesseract telepítőjét dupla kattintással:

3. lépés: Válassza ki a nyelvet

A Tesseract telepítője számos nyelvet támogat. A telepítő felülettel való interakcióhoz válassza a „ angol ' nyelvként, majd kattintson a ' rendben ”:

4. lépés: Telepítse a Tesseactot

Ezt követően a Tesseract OCR beállítási varázsló jelenik meg a képernyőn. A Tesserac telepítésének megkezdéséhez nyomja meg a „ Következő ” gomb:

Elfogadni a „ Licencszerződés ', kattints a ' Egyetértek ” gomb:

Válaszd ki a ' Telepítés mindenki számára ezen a számítógépen ” opciót, és nyomja meg a „ Következő ” gomb:

Ha szkriptadatokat szeretne hozzáadni vagy másik nyelvet szeretne megadni, jelölje be a megfelelő jelölőnégyzeteket, és nyomja meg a „ Következő ” gombot. Mivel ezért nem kívánunk további adatszkriptet vagy nyelvet, folytatjuk az alapértelmezett kiválasztott opciókkal:

Válassza ki a telepítési helyet, és kattintson a „ Következő ” gomb:

Ha nem szeretne parancsikont létrehozni a Start menüben, akkor jelölje be a „ Ne készítsen parancsikont ” jelölőnégyzetet, és nyomja meg a „ Telepítés ” gomb:

Ezt követően elindul a Tesseract telepítése. Várja meg, amíg a telepítés befejeződik, és nyomja meg a „ Következő ” gomb:

Végül kattintson a „ Befejez ” gomb:

5. lépés: Állítsa be a környezeti változót

A telepítés után be kell állítania a Tesseract környezeti változóját. Ehhez először keresse fel azt a könyvtárat, ahová a Tesseractet telepítette, és másolja ki az elérési utat a ' Cím ' rúd:

Keressen a ' Környezeti változók ' ban,-ben ' üzembe helyezés ' menüt, és nyissa meg a ' Szerkessze a rendszer környezeti változóit ”:

A beállításokon belül navigáljon a „ Fejlett ” beállítási menüt, és kattintson a „ Környezeti változók ” gomb:

Válaszd a ' Pálya ' Változó a ' Rendszerváltozók ' panelt, és nyomja meg a ' Szerkesztés ” gomb:

Utána ' Környezeti változó szerkesztése ” ablak jelenik meg a képernyőn. Megnyomni a ' Új ” gombot, és illessze be ide a másolt Tesseract telepítési könyvtár elérési útját. Végül kattintson a „ rendben ” gomb:

6. lépés: Ellenőrizze a Tesseract telepítését

A Tesseract telepítésének ellenőrzéséhez nyissa meg a Windows parancssort a „ Parancssor ' ban,-ben ' üzembe helyezés ” menü:

Nézze meg a Tesseract verzióját a megadott paranccsal:

> tesserakt --változat

Az alábbi kimenet azt jelzi, hogy sikeresen telepítettük a Tesseract verzióját ' v5.2.0 ” Windows rendszeren:

Lépjünk tovább, és nézzük meg, hogyan kell használni a Tesseractot Windows rendszeren.

Hogyan kell használni a Tesseract Windows rendszeren?

A Tesseract a kézírás olvasására vagy a képekből szöveg kivonására szolgál. Lássuk, hogyan működik:

1. lépés: Válassza a Kép lehetőséget

Válassza ki a képet, amelyből szöveget szeretne kivonni. Ahogy választottuk' 1.png ”:

2. lépés: Szöveg kibontása a képből

A CMD kinyitása után. Használd a ' CD ” paranccsal módosíthatja azt a könyvtárat, ahol a kép tárolódik. Ezután futtassa a „ tesserakt ' parancsot, és adja meg a képfájl nevét a megadott módon 1.png ”. Az ' Szöveg ” paraméter mutatja a kimeneti fájl nevét:

> CD C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesserakt 1 .png 'Szöveg'

3. lépés: Ellenőrizze a szövegkivonást

A szövegkivonás ellenőrzéséhez navigáljon abban a könyvtárban, ahol a képfájl létezik. Láthatja, hogy a kimeneti fájl ' Szöveg ” is ide van mentve. Kattintson duplán a kimeneti fájlra, hogy ellenőrizze, hogy a tesseract kibontotta-e a szöveget a képből vagy sem:

Láthatja, hogy sikeresen kibontottuk a szöveget a Tesseract parancssori eszközzel:

Bemutattuk a Tesseract Windows rendszeren történő telepítésének és használatának technikáját.

Következtetés

A Tesseract Windows rendszerre történő telepítéséhez le kell töltenie a Tesseract telepítőjét. Ebből a célból kövesse a cikk első szakaszát. Ezután állítsa be a Path környezeti változót a Tesseract használatára, és a Windows parancssorból érje el. Ezután válassza ki a képfájlt, és használja a „ Tesseact ” parancs segítségével felismerheti és kivonhatja a szöveget a képből. Itt megtanulta telepíteni és használni a ' Tesseact ” ablakokon.