דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תוכנה
  3. עזרה בהמרת דפים סרוקים לאקסל

עזרה בהמרת דפים סרוקים לאקסל

מתוזמן נעוץ נעול הועבר תוכנה
21 פוסטים 5 כותבים 648 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • בערלב מנותק
    בערלב מנותק
    בערל ניהול
    כתב ב נערך לאחרונה על ידי בערל
    #1

    יש לי כמה מסמכים סרוקים שאני מעוניין להמיר לטבלת אקסל

    התנסיתי עם תוכנת ABBYY FineReader שעושה ב''ה עבודה די טובה ומזהה בצורה מצוינת טקסט (באנגלית).

    יש בתוכנה אופציה לייצוא אזור מותאם אישית וייבוא על עמודים נוספים ועיינו כאן

    אפשרות זו שימושית מאוד למקרה שלי - מסמך אם יותר ממאה עמודים במבנה זהה.

    אבל, מפני שהמסך די צפוף בטקסט ובגלל שיש לפעמים סטייה של מילימטרים בזווית הסריקה של המסמך, אפשרות זו לא רלוונטית בשבילי. ולא מצאתי מנוס ולעבור ידנית עמוד עמוד ולסדר עליו טבלה מדוייקת, ועל הרבה עמודים אני צריך להשתמש עם אופציית יישור הטקסט (באפשרויות התמונה בתוכנה) אחרת יש סטייה של העמודות.

    מצורף קובץ לדוגמה שהורדתי ברשת
    הדוגמה קצת מוגזמת אבל זה בכדי להסביר את הכוונה.



    מקור:
    f46e9731-3a65-468a-9fba-e5331238b6c3-image.png



    תהליך היישור:
    fc50f24c-1791-46d6-8571-99d55c92e1b4-image.png



    לאחר היישור ראו איזה פלא:
    c0cb6e9f-406d-4b19-8af1-f7ba020b2b54-image.png
    קובץ הדוגמה במקור: Name List.pdf




    אשמח לרעיונות כיצד ניתן לקצר את זמן העבודה

    אולי יש תוכנה שיודעת ליישר את הטקסט על הדף באופן אוטומטי?
    אולי יש טריק ב-FineReader שאיני מודע אליו?
    הברקות אחרות?

    תודה רבה!

    WWWW תגובה 1 תגובה אחרונה
    1
    • WWWW מנותק
      WWWW מנותק
      WWW
      השיב לבערל ב נערך לאחרונה על ידי
      #2

      @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

      אבל, מפני שהמסך די צפוף בטקסט ובגלל שיש לפעמים סטייה של מילימטרים בזווית הסריקה של המסמך,

      אולי יש תוכנה שיודעת ליישר את הטקסט על הדף באופן אוטומטי?
      אולי יש טריק ב-FineReader שאיני מודע אליו?
      הברקות אחרות?

      אולי לסרוק את הדפים מחדש בסורק מקצועי, ואז הכל יהיה ישר.

      WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

      בערלב תגובה 1 תגובה אחרונה
      1
      • בערלב מנותק
        בערלב מנותק
        בערל ניהול
        השיב לWWW ב נערך לאחרונה על ידי
        #3

        @www אמר בעזרה בהמרת דפים סרוקים לאקסל:

        אולי לסרוק את הדפים מחדש בסורק מקצועי, ואז הכל יהיה ישר.

        הסטייה היא במקסימום 2 מילימטר, ובד''כ פחות. יש סורק שיכול להתגבר על זה?

        רחמיםר WWWW 2 תגובות תגובה אחרונה
        0
        • רחמיםר מנותק
          רחמיםר מנותק
          רחמים מורחק
          השיב לבערל ב נערך לאחרונה על ידי
          #4

          @בערל זו לא בעיה של סיבוב ימינה ב2 מילימטר, זו בעיה של עיוות פרספקטיבה, זה נראה שסרקו את המסמך עם צלמה שמצלמת ממרחק, ולא עם סורק עם משטח סריקה שמניחים עליו בצורה צמודה את המסמך.

          בערלב תגובה 1 תגובה אחרונה
          3
          • בערלב מנותק
            בערלב מנותק
            בערל ניהול
            השיב לרחמים ב נערך לאחרונה על ידי
            #5

            @רחמים אמר בעזרה בהמרת דפים סרוקים לאקסל:

            @בערל זו לא בעיה של סיבוב ימינה ב2 מילימטר, זו בעיה של עיוות פרספקטיבה, זה נראה שסרקו את המסמך עם צלמה שמצלמת ממרחק, ולא עם סורק עם משטח סריקה שמניחים עליו בצורה צמודה את המסמך.

            הלכתי על דוגמה קיצונית בשביל להסביר ולהמחיש את העניין (זה מסמך אקראי שמצאתי בגוגל, ודומה למקרה שלי אבל בצורה קיצונית)

            במציאות זה מסמך סרוק דרך מזין של מדפסת איכותית ויש סטייה ממש קטנה בשוליים.

            OdedDvirO תגובה 1 תגובה אחרונה
            0
            • WWWW מנותק
              WWWW מנותק
              WWW
              השיב לבערל ב נערך לאחרונה על ידי
              #6

              @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

              הסטייה היא במקסימום 2 מילימטר, ובד''כ פחות. יש סורק שיכול להתגבר על זה?

              מאמין שכן, אין לי ניסיון.

              WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

              תגובה 1 תגובה אחרונה
              0
              • OdedDvirO מנותק
                OdedDvirO מנותק
                OdedDvir
                השיב לבערל ב נערך לאחרונה על ידי
                #7

                @בערל אם הסטייה היא בזוית קבועה, אתה יכול ליצור פעולת-אצווה Batch-Action בפוטושופ שתסובב לך את כל התמונות בתיקייה באותה הזוית.

                בערלב 2 תגובות תגובה אחרונה
                1
                • בערלב מנותק
                  בערלב מנותק
                  בערל ניהול
                  השיב לOdedDvir ב נערך לאחרונה על ידי
                  #8

                  @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                  @בערל אם הסטייה היא בזוית קבועה, אתה יכול ליצור פעולת-אצווה Batch-Action בפוטושופ שתסובב לך את כל התמונות בתיקייה באותה הזוית.

                  בד''כ באותה זווית. אבל:

                  1. זה לא על כל הדפים
                  2. זה לא תמיד באותו גודל
                  3. אפשר לעשות זאת באמצעות FineReader כמו בתמונה למעלה ולהכיל על כל הדפים.
                  תגובה 1 תגובה אחרונה
                  0
                  • בערלב מנותק
                    בערלב מנותק
                    בערל ניהול
                    השיב לOdedDvir ב נערך לאחרונה על ידי בערל
                    #9

                    @odeddvir

                    התחלתי באמת להסתכל על כיוון של תוכנות לשיפור תמונות ומצאתי סקריפט של imagemagick שע''פ ההמחשות עושה עבודה מדהימה

                    http://www.fmwconcepts.com/imagemagick/textcleaner/index.php

                    אני מסתבך בהפעלה שלו על ווינדוס. עבדתי לפי ההוראות כאן. לא הבנתי את שלב 4 ואולי זה מה שתוקע אותי.

                    מצורף תמונה של הפלט לאחר ניסיון הרצה:
                    e6581954-7e6c-4380-b51c-f73b0beb9b30-image.png

                    נראה לכם זה הכיוון שיכול לעזור למקרה שלי?
                    אם כן, אעריך מאוד עזרה בהפעלת הסקריפט.

                    OdedDvirO תגובה 1 תגובה אחרונה
                    0
                    • OdedDvirO מנותק
                      OdedDvirO מנותק
                      OdedDvir
                      השיב לבערל ב נערך לאחרונה על ידי
                      #10

                      @בערל לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש...

                      אבל מצאתי פרוייקט בגיטהב שמתיימר לעשות זאת בהצלחה:
                      https://github.com/JPLeoRX/opencv-text-deskew
                      אין לי פייתון מותקן כרגע כדי לבדוק, אבל זה נראה מאוד מבטיח.

                      בערלב yossizY 2 תגובות תגובה אחרונה
                      1
                      • בערלב מנותק
                        בערלב מנותק
                        בערל ניהול
                        השיב לOdedDvir ב נערך לאחרונה על ידי בערל
                        #11

                        @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                        @בערל לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש...

                        בדקתי את הארגומנטים הרלוונטיים בדוגמאות שלו, ולא היה נראה לי שצריך להגדיר את גודל הסיבוב והיישור. לכן התלהבתי.

                        @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                        אבל מצאתי פרוייקט בגיטהב שמתיימר לעשות זאת בהצלחה:
                        https://github.com/JPLeoRX/opencv-text-deskew
                        אין לי פייתון מותקן כרגע כדי לבדוק, אבל זה נראה מאוד מבטיח.

                        הורדתי, התקנתי פייתון. מה אני עושה עם זה עכשיו? סליחה על הבורות... לא מצאתי שם פירוט או מדריך שימוש...

                        yossizY תגובה 1 תגובה אחרונה
                        1
                        • yossizY מחובר
                          yossizY מחובר
                          yossiz
                          השיב לבערל ב נערך לאחרונה על ידי
                          #12

                          @בערל תוכנת finereader כבר כוללת זיהוי אוטומטי של סיבוב. אם הזיהוי האטומטי שלהם לא מצליח, האם יש סיבה להאמין שפרוייקט אקראי בגיטהאב יזהה יותר טוב?

                          📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                          בערלב תגובה 1 תגובה אחרונה
                          2
                          • yossizY מחובר
                            yossizY מחובר
                            yossiz
                            השיב לOdedDvir ב נערך לאחרונה על ידי
                            #13

                            @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                            לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש

                            נראה לי שהוא כן מזהה אוטומטי.
                            (אני לא מאמין שזה יותר טוב מהזיהוי המובנה של ABBYY)

                            אם כבר יש סקריפט יותר טוב שמיועד לשורות טקסט:
                            http://www.fmwconcepts.com/imagemagick/textdeskew/index.php

                            📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                            בערלב תגובה 1 תגובה אחרונה
                            3
                            • OdedDvirO מנותק
                              OdedDvirO מנותק
                              OdedDvir
                              כתב ב נערך לאחרונה על ידי
                              #14

                              @בערל מצאתי תוכנה בשם Scan-Taylor ל-Windows עם ממשק גרפי, בלי צורך להתקין Python או Bash, ושאר טרחות.
                              הנה קישור לדף גיטהאב עם קובץ בינארי להורדה: https://github.com/scantailor/scantailor/releases/tag/RELEASE_0_9_11_1
                              היא מקבלת TIFF או JPG בלבד. אבל מסוגלת לזהות לבד את הכיוון, ותומכת בטקסט מימין לשמאל.

                              בערלב תגובה 1 תגובה אחרונה
                              4
                              • בערלב מנותק
                                בערלב מנותק
                                בערל ניהול
                                השיב לOdedDvir ב נערך לאחרונה על ידי
                                #15

                                @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                @בערל מצאתי תוכנה בשם Scan-Taylor ל-Windows עם ממשק גרפי, בלי צורך להתקין Python או Bash, ושאר טרחות.
                                הנה קישור לדף גיטהאב עם קובץ בינארי להורדה: https://github.com/scantailor/scantailor/releases/tag/RELEASE_0_9_11_1
                                היא מקבלת TIFF או JPG בלבד. אבל מסוגלת לזהות לבד את הכיוון, ותומכת בטקסט מימין לשמאל.

                                תודה רבה!

                                בדקתי וזה עושה עבודה די טובה ומשפרת הרבה!

                                יש שם אפשרות לזיהוי אוטומטי, אבל, לא מצאתי דרך להגדיר זיהוי אוטומטי לכל התמונות בפרוייקט.
                                כלומר, יש שם אפשרות להכיל את ההגדרה על כל העמודים אבל אז הוא מכיל את הזווית שנקלטה אוטומטי בעמוד הראשון ולא בודק את כולם ומתאים אישית.
                                לדוגמה: הראשון זוהה שצריך הטייה של 0.12, השני 0.38, השלישי 0.19
                                במציאות הוא מכיל על כולם 0.12

                                ובנוסף, האם יש אפשרות לדלג על ההגדרות הנוספות? של הרזולוציה וכו'.
                                אני חושב שהוא מזיק לי לאיכות התמונה.

                                OdedDvirO תגובה 1 תגובה אחרונה
                                0
                                • בערלב מנותק
                                  בערלב מנותק
                                  בערל ניהול
                                  השיב לyossiz ב נערך לאחרונה על ידי
                                  #16

                                  @yossiz אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                  @בערל תוכנת finereader כבר כוללת זיהוי אוטומטי של סיבוב. אם הזיהוי האטומטי שלהם לא מצליח,

                                  התמונות שהעליתי למעלה הם אכן לפני עיבוד, והם באמת מצליחים לשפר בהרבה, אבל לא מספיק בכלל.

                                  האם יש סיבה להאמין שפרוייקט אקראי בגיטהאב יזהה יותר טוב?

                                  את זה אני רוצה לבדוק... 🕵 😏

                                  תגובה 1 תגובה אחרונה
                                  0
                                  • בערלב מנותק
                                    בערלב מנותק
                                    בערל ניהול
                                    השיב לyossiz ב נערך לאחרונה על ידי
                                    #17

                                    @yossiz אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                    אם כבר יש סקריפט יותר טוב שמיועד לשורות טקסט:
                                    http://www.fmwconcepts.com/imagemagick/textdeskew/index.php

                                    אני אשמח מאוד לבדוק אותו, אבל אני מקבל אותו שגיאה כמקודם.

                                    b31dd0fd-9c07-49ba-9835-12cf72b5b5ca-image.png

                                    מה יכול להיות?

                                    תודה רבה

                                    OdedDvirO תגובה 1 תגובה אחרונה
                                    0
                                    • OdedDvirO מנותק
                                      OdedDvirO מנותק
                                      OdedDvir
                                      השיב לבערל ב נערך לאחרונה על ידי OdedDvir
                                      #18

                                      @בערל נסה למקם את קובץ הפלט בתיקייה שאינה root. יש הגבלות על יצירת קבצים בתוך התיקיה הראשית של הכונן.

                                      בערלב תגובה 1 תגובה אחרונה
                                      1
                                      • בערלב מנותק
                                        בערלב מנותק
                                        בערל ניהול
                                        השיב לOdedDvir ב נערך לאחרונה על ידי בערל
                                        #19

                                        @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                        @בערל נסה למקם את הקובץ בתיקייה שאינה root. יש הגבלות על קבצים שנמצאים בתיקיה הראשית של הכונן.

                                        ניסיתי, ראה בתמונה למעלה.
                                        3d5113a2-b404-4398-bfa6-a98fdedb9e75-image.png

                                        רציתי עכשיו שיהיה יותר קריא אז בחרתי בנתיב הקצר ביותר...

                                        תגובה 1 תגובה אחרונה
                                        2
                                        • OdedDvirO מנותק
                                          OdedDvirO מנותק
                                          OdedDvir
                                          השיב לבערל ב נערך לאחרונה על ידי OdedDvir
                                          #20

                                          @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                          יש שם אפשרות לזיהוי אוטומטי, אבל, לא מצאתי דרך להגדיר זיהוי אוטומטי לכל התמונות בפרוייקט.

                                          בדוקומנטציה של התוכנה מצויין כי התוכנה באה עם ממשק שורת פקודה, לצורך עבודות אצווה.
                                          כדי להריץ עיבוד על קובץ מסויים, פתח PowerShell, ותריץ כך:

                                          .\scantailor-cli.exe --layout=1 --layout-direction=rl .\scanned\page1.jpg .\output
                                          

                                          וכדי להריץ על כל התמונות בתיקיה scanned תוכל ליצור סקריפט.

                                          ובנוסף, האם יש אפשרות לדלג על ההגדרות הנוספות? של הרזולוציה וכו'.
                                          אני חושב שהוא מזיק לי לאיכות התמונה.

                                          יש אפשרות לציין את ה-DPI של התמונה וכן את מצב הצבע.
                                          תפעיל את scantailor-cli בלי פרמטרים כדי לקבל פירוט של כל אפשרויות הריצה.
                                          אם זה אפשרי, מומלץ כמובן לסרוק את המסמכים בהפרדה גבוהה 600 DPI ובמצב צבעוני או גווני אפור, כדי לקבל תוצאות טובות יותר.

                                          WWWW תגובה 1 תגובה אחרונה
                                          2

                                          • 1
                                          • 2
                                          בא תתחבר לדף היומי!
                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • דף הבית
                                          • קטגוריות
                                          • פוסטים אחרונים
                                          • משתמשים
                                          • חיפוש
                                          • חוקי הפורום