כיצד להתקין את Tesseract ב-Windows

Kyzd Lhtqyn T Tesseract B Windows



Tesseract הוא כלי לזיהוי טקסט בקוד פתוח, הזמין באופן חופשי, הידוע גם בשם OCR (זיהוי תווים אופטי). הוא משמש בעיקר לזיהוי ולחילוץ טקסט מתמונות. זה יקרא טקסט מנתוני תמונה ויכתוב פלט בקובץ txt חדש. Tesseract עובדת גם תחת פייתון, מכיוון שהיא משמשת בעיקר לזיהוי כתב יד מתמונות. הוא משתמש במודל LSTR (זיכרון לטווח קצר ארוך). Tesseract עובד תחת רישיון Apache 2.0.

אנו נרחיב על השיטה להתקנת Tesseract על Windows בבלוג זה.







אז בואו נתחיל!



כיצד להתקין את Tesseract על Windows?

ה-Tesseract הוא כלי שורת פקודה המשמש לחילוץ טקסט מתמונות. כדי להתקין את Tesseract ב-Windows, עליך לעקוב אחר ההוראות המפורטות להלן.



שלב 1: הורד את מתקין Tesseract





ראשית, נווט אל הקישור המצורף למטה והורד את מתקין Tesseract בהתאם למפרט המערכת שלך:

https: // github.com / UB-מנהיים / tesseract / שָׁבוּעַ



שלב 2: הפעל את Tesseract Installer

בקר ב' הורדות ” ספרייה שבה מורידים את תוכנית ההתקנה של Tesseract. על מנת להתקין את Tesseract על Windows, הפעל את מתקין Tesseract על ידי לחיצה כפולה עליו:

שלב 3: בחר שפה

שפות רבות נתמכות על ידי מתקין Tesseract. כדי ליצור אינטראקציה עם ממשק המשתמש של המתקין, בחר ' אנגלית ' כשפה שלך ולחץ על ' בסדר ”:

שלב 4: התקן את Tesseract

לאחר שתעשה זאת, יופיע אשף ההגדרה של Tesseract OCR על המסך. כדי להתחיל בהתקנת Tesseract, לחץ על ' הַבָּא ' כפתור:

כדי לקבל את ' הסכם רישיון ', לחץ על ' אני מסכים ' כפתור:

בחר את ' להתקין לכל מי שמשתמש במחשב זה ' אפשרות ולחץ על ' הַבָּא ' כפתור:

אם ברצונך להוסיף נתוני סקריפט או לכלול שפה אחרת, סמן את תיבות הסימון המתאימות ולחץ על ' הַבָּא ' כפתור. מכיוון שאיננו רוצים סקריפט או שפה נוספים של נתונים, נמשיך עם אפשרויות ברירת המחדל שנבחרו:

בחר את מיקום ההתקנה ולחץ על ' הַבָּא ' כפתור:

אם אינך רוצה ליצור קיצור דרך בתפריט 'התחל', סמן את ' אל תיצור קיצורי דרך תיבת הסימון ולחץ על ' להתקין ' כפתור:

לאחר מכן, תתחיל התקנת Tesseract. המתן עד שההתקנה תסתיים ולחץ על ' הַבָּא ' כפתור:

לבסוף, לחץ על ' סיים ' כפתור:

שלב 5: הגדר משתנה סביבה

לאחר ההתקנה, עליך להגדיר את משתנה הסביבה של ה-Tesseract. לשם כך, בקר תחילה בספרייה שבה התקנת את ה-Tesseract והעתק את הנתיב מה-' כתובת 'סרגל:

בצע חיפוש אחר ' משתני סביבה ' בתוך ה ' סטארט - אפ תפריט ופתח את ' ערוך את משתני סביבת המערכת ”:

בתוך ההגדרות, נווט אל ' מִתקַדֵם ' תפריט ההגדרות ולחץ על ' משתני סביבה ' כפתור:

בחר את ' נָתִיב 'משתנה מה' משתני מערכת ', ולחץ על ' לַעֲרוֹך ' כפתור:

אחרי זה ' ערוך משתנה סביבה ' יופיע חלון על המסך. לחץ על ' חָדָשׁ ' לחצן והדבק כאן את נתיב ספריית ההתקנה של Tesseract שהועתק. לבסוף, לחץ על ' בסדר ' כפתור:

שלב 6: אמת את התקנת Tesseract

כדי לאמת את התקנת Tesseract, פתח את שורת הפקודה של Windows על ידי חיפוש ' שורת פקודה ' בתוך ה ' סטארט - אפ תפריט:

בדוק את גרסת Tesseract באמצעות הפקודה שסופקה:

> tesseract --גִרְסָה

הפלט הנתון להלן מציין שהתקנו בהצלחה את גרסת Tesseract ' v5.2.0 'בווינדוס:

בואו נתקדם כדי לבדוק כיצד להשתמש ב-Tesseract ב-Windows.

כיצד להשתמש ב-Tesseract ב-Windows?

ה-Tesseract משמש לקריאת כתב יד או לחילוץ טקסט מתמונות. בוא נראה איך זה עובד:

שלב 1: בחר תמונה

בחר את התמונה שממנה ברצונך לחלץ טקסט. כפי שבחרנו' 1.png ”:

שלב 2: חלץ טקסט מתמונה

לאחר פתיחת ה-CMD. השתמש ב' CD ' הפקודה כדי לשנות את הספרייה שבה מאוחסנת התמונה. לאחר מכן הפעל את ' tesseract ' הפקודה והגדר את שם קובץ התמונה כפי שציינו ' 1.png '. ה ' טֶקסט ' מופעי פרמטר מציינים את השם של קובץ הפלט:

> CD C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesseract 1 .png 'טֶקסט'

שלב 3: ודא חילוץ טקסט

כדי לאמת את חילוץ הטקסט, נווט בספרייה שבה קיים קובץ התמונה. אתה יכול לראות שקובץ הפלט ' טֶקסט ” נשמר גם כאן. לחץ פעמיים על קובץ הפלט כדי לבדוק אם ה-tesseract חילץ את הטקסט מהתמונה או לא:

אתה יכול לראות שחילצנו את הטקסט בהצלחה באמצעות כלי שורת הפקודה של Tesseract:

הדגמנו את הטכניקה להתקין ולהשתמש ב-Tesseract ב-Windows.

סיכום

כדי להתקין את Tesseract ב-Windows, יש צורך להוריד את תוכנית ההתקנה של Tesseract. למטרה זו, עקוב אחר המפגש הראשון של מאמר זה. לאחר מכן הגדר את משתנה סביבת הנתיב לשימוש וגישה ל-Tesseract משורת הפקודה של Windows. לאחר מכן, בחר את קובץ התמונה והשתמש ב-' Tesseract ” הפקודה לזהות ולחלץ את הטקסט מהתמונה. כאן, למדת להתקין כמו גם להשתמש ב' Tesseract 'על חלונות.