דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תוכנה
  3. תוכנה לזיהוי טקסט בעברית (OCR)

תוכנה לזיהוי טקסט בעברית (OCR)

מתוזמן נעוץ נעול הועבר תוכנה
20 פוסטים 10 כותבים 3.8k צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • yossizY מנותק
    yossizY מנותק
    yossiz
    השיב לרחמים ב נערך לאחרונה על ידי yossiz
    #9

    @רחמים אני חייב להגיד לך שכל פעם שאני רואה איזכור של תוכנת ה-OCR שלך אני נהיה ירוק מקנאה. באמת. אין לי מושג איפה מתחילים עם דבר כזה.
    האם תסכים לתת לנו ממש על קצה המזלג מושג של איפה מתחילים עם בנייה של תוכנה כזאת? (אל תדאג, לא נראה לי שאני אף פעם אגיע לרמה של לבנות מתחרה...).

    (נ.ב. אני לא רוצה משהו בשפה פשוטה, תכניס כמה שיותר מושגים טכניים בבקשה 🙂 )

    📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

    רחמיםר תגובה 1 תגובה אחרונה
    9
    • רחמיםר מנותק
      רחמיםר מנותק
      רחמים מורחק
      השיב לyossiz ב נערך לאחרונה על ידי
      #10

      @yossiz מה אני יכול לחדש לך, אחרי שמן הסתם ראיתי את הקוד פתוח של tesseract וכל הגיטהב מלא קוד של OCR בלי סוף.

      yossizY תגובה 1 תגובה אחרונה
      0
      • yossizY מנותק
        yossizY מנותק
        yossiz
        השיב לרחמים ב נערך לאחרונה על ידי
        #11

        @רחמים נו נו, אם אתה לא רוצה זה זכותך לסרב...
        אבל אין לי כרגע זמן וראש לקרוא קוד מקור ב-C כדי להבין איך הדברים עובדים... בכל מקרה, כל הכבוד!
        רק תגיד לי, אתה משתמש בספרייות חיצוניות עבור זיהוי הטקסט, או שמימשת את הכל בעמצך?
        במחשבה שנייה, מן הסתם התשובה יגרום לי לקנאות בך יותר... :smile:

        📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

        רחמיםר תגובה 1 תגובה אחרונה
        5
        • רחמיםר מנותק
          רחמיםר מנותק
          רחמים מורחק
          השיב לyossiz ב נערך לאחרונה על ידי
          #12

          @yossiz יש המון הסברים במדור ההסברים של tesseract בגיטהב, וגם במרחבי הרשת.
          צדקת, מימשתי הכל בעצמי, וזאת בגלל שהתוכנה שלי מותאמת לכל שפה ובמיוחד לעברית, בשביל זה אין לי שום תלות בשום קוד חיצוני, וכל דבר אני יכול לתקן ולשפר אם צריך.

          וכמו שאמר יוסף, בלעדי! האלקים יענה את שלום פרעה.
          כך גם אני [מזרעה דיוסף כאתינא] זו לא חכמה שלי אלא של האלוקים☝

          תגובה 1 תגובה אחרונה
          14
          • בערלב מנותק
            בערלב מנותק
            בערל ניהול
            כתב ב נערך לאחרונה על ידי
            #13

            מכיוון שאיני זקוק לכמויות מסחריות אשאר בינתיים עם FineReader

            מהו הקצת שאפשר ללמד אותו? ואיך?

            הכי מטריד אותי הבלבול שלו בין י ל '

            תודה רבה!

            yair-naY תגובה 1 תגובה אחרונה
            0
            • yair-naY מנותק
              yair-naY מנותק
              yair-na
              השיב לבערל ב נערך לאחרונה על ידי
              #14

              @בערל בד"כ רזולוציה גבוהה יותר מספקת תוצאות טובות יותר.

              תגובה 1 תגובה אחרונה
              0
              • רחמיםר מנותק
                רחמיםר מנותק
                רחמים מורחק
                כתב ב נערך לאחרונה על ידי
                #15

                חידושים בתוכנה לזיהוי תוים OCR גירסה 2.54

                תגובה 1 תגובה אחרונה
                0
                • ד מנותק
                  ד מנותק
                  דן בר לב
                  כתב ב נערך לאחרונה על ידי
                  #16

                  בקהילה שלנו רצינו להקים ספרייה דיגיטלית עם חיפוש בספרים של מוהרא"ש, (אשר בנחל, אלפי קונטרסים, וכו וכו) אלא שמאות ספרים רק סרוקים. חיפשנו תוכנה לOCR חלקם טובות חלקם פחות, וזה לא התאים כל כך למה שאנחנו צריכים
                  אבל מאז התחלנו לעבוד עם התוכנת זיהוי תווים של רחמים, הכל פשוט רץ במהירות באיכות בדיוק כזה ששום תוכנה אחרת לא סיפקה לנו

                  אנחנו עובדים יום יום על התוכנה הזו לפענח עוד ספרים ועוד ספרים

                  תגובה 1 תגובה אחרונה
                  5
                  • S מנותק
                    S מנותק
                    shlomo57251
                    השיב לבערל ב נערך לאחרונה על ידי
                    #17

                    @בערל
                    ניסיתי את התוכנה אבל היא ממירה לאנגלית בכל אופן אני לא מצאתי בה אפשרות כזאת

                    תגובה 1 תגובה אחרונה
                    0
                    • D מנותק
                      D מנותק
                      davidnead
                      כתב ב נערך לאחרונה על ידי davidnead
                      #18

                      @רחמים

                      1. האם בספרים מודרניים (שהוקלדו במחשב) התכנה שלך מגיע לקרוב למאה אחוז דיוק, בכל סוגי הפונטים והעימודים? זה מה שהייתי מצפה, ואני חושב שפינדרידר פחות או יותר עושה את זה.

                      2. לגבי ספרים ישנים, אני חושב שניתן לחלק אותם ל10-20 לכל היותר סוגים של גופנים+עימוד (כולל צפיפות גופן וכדו') למעט חריגים, ובעיקר של סגנון שפה ואוצר מילים. (תנכ"י, חזל"י, רבני וכו').
                        הייתי חושב שהדרך האידיאלית זה לקחת מדגם של ספרים כאלו, לייצר לכל אחד מילון מותאם אישית באופן שתיארת. ובפעם הבאה שאינ סורק ספר - לעבור עליו 3 שניות כדי להחליט לאיזה "פרופיל" הוא מתאים ולסרוק בהתאם, עם תוצאות מיטביות.
                        התכנה שלך מאפשרת את זה? א"כ, למה שלא תשקיע קצת ותביא דבר כזה מובנה?
                        נ.ב. אם תיקח את זה ברצינות, יתכן שאוכל לתווך לך מישהו שיוכל לתרום יכולות מתקדמות לנושא של אוצר מילים וסגנון שפה בספרים ישנים.

                      רחמיםר תגובה 1 תגובה אחרונה
                      1
                      • רחמיםר מנותק
                        רחמיםר מנותק
                        רחמים מורחק
                        השיב לdavidnead ב נערך לאחרונה על ידי רחמים
                        #19

                        @davidnead אמר בתוכנה לזיהוי טקסט בעברית (OCR):

                        @רחמים

                        1. האם בספרים מודרניים (שהוקלדו במחשב) התכנה שלך מגיע לקרוב למאה אחוז דיוק, בכל סוגי הפונטים והעימודים? זה מה שהייתי מצפה, ואני חושב שפינדרידר פחות או יותר עושה את זה.

                        2. לגבי ספרים ישנים, אני חושב שניתן לחלק אותם ל10-20 לכל היותר סוגים של גופנים+עימוד (כולל צפיפות גופן וכדו') למעט חריגים, ובעיקר של סגנון שפה ואוצר מילים. (תנכ"י, חזל"י, רבני וכו').
                          הייתי חושב שהדרך האידיאלית זה לקחת מדגם של ספרים כאלו, לייצר לכל אחד מילון מותאם אישית באופן שתיארת. ובפעם הבאה שאינ סורק ספר - לעבור עליו 3 שניות כדי להחליט לאיזה "פרופיל" הוא מתאים ולסרוק בהתאם, עם תוצאות מיטביות.
                          התכנה שלך מאפשרת את זה? א"כ, למה שלא תשקיע קצת ותביא דבר כזה מובנה?
                          נ.ב. אם תיקח את זה ברצינות, יתכן שאוכל לתווך לך מישהו שיוכל לתרום יכולות מתקדמות לנושא של אוצר מילים וסגנון שפה בספרים ישנים.

                        1. אם הכתב ברור אפשר להגיע גם למאה אחוז דיוק, מה עושה את הכתב פחות ברור? אותיות דבוקות, שבורות, מרוחות, דומות מאוד אחת לשניה בגלל איכות ירודה של הסריקה וכדומה.
                          וזה מה שכתב לי אחד הלקוחות:
                          מתוך 50 עמודים שפענחתי היו עד כה 2 טעויות (ספר בן 40 שנה...) מקצועי במיוחד!!!
                          המלצות נוספות ראה באתר שלי כאן

                        2. כבר כיום ניתן לבנות מילון מותאם אישית לספר מסויים ולהשתמש בו שוב ושוב בספרים דומים, כמו כן ניתן לבנות מילון בסיסי עבור סגנון מסויים של ספרים, ולהשתמש בו כתבנית עבור בניית מילונים שיהיו מבוססים עליו עם תוספת של התאמה לספר שיש בו יחודיות כל שהיא.
                          אני משקיע כל הזמן בתוכנה וכל הזמן משפר אותה גם בדיוק הפיענוח, גם בחויית משתמש, וגם במהירות הפיענוח, והוספת פיצ'רים חשובים.
                          אשמח לשיתוף פעולה, היה בקשר במייל.

                        רחמיםר תגובה 1 תגובה אחרונה
                        5
                        • רחמיםר מנותק
                          רחמיםר מנותק
                          רחמים מורחק
                          השיב לרחמים ב נערך לאחרונה על ידי
                          #20
                          פוסט זה נמחק!
                          תגובה 1 תגובה אחרונה
                          0

                          בא תתחבר לדף היומי!
                          • התחברות

                          • אין לך חשבון עדיין? הרשמה

                          • התחברו או הירשמו כדי לחפש.
                          • פוסט ראשון
                            פוסט אחרון
                          0
                          • דף הבית
                          • קטגוריות
                          • פוסטים אחרונים
                          • משתמשים
                          • חיפוש
                          • חוקי הפורום