תחומים
    • הרשמה
    • התחברות
    • חיפוש
    • קטגוריות
    • פוסטים אחרונים
    • משתמשים
    • חיפוש
    חוקי הפורום

    עזרה בהמרת דפים סרוקים לאקסל

    תוכנה
    5
    21
    210
    טוען פוסטים נוספים
    • מהישן לחדש
    • מהחדש לישן
    • הכי הרבה הצבעות
    תגובה
    • הגב כנושא
    התחבר בכדי לפרסם תגובה
    נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
    • בערל
      בערל ניהול נערך לאחרונה על ידי בערל

      יש לי כמה מסמכים סרוקים שאני מעוניין להמיר לטבלת אקסל

      התנסיתי עם תוכנת ABBYY FineReader שעושה ב''ה עבודה די טובה ומזהה בצורה מצוינת טקסט (באנגלית).

      יש בתוכנה אופציה לייצוא אזור מותאם אישית וייבוא על עמודים נוספים ועיינו כאן

      אפשרות זו שימושית מאוד למקרה שלי - מסמך אם יותר ממאה עמודים במבנה זהה.

      אבל, מפני שהמסך די צפוף בטקסט ובגלל שיש לפעמים סטייה של מילימטרים בזווית הסריקה של המסמך, אפשרות זו לא רלוונטית בשבילי. ולא מצאתי מנוס ולעבור ידנית עמוד עמוד ולסדר עליו טבלה מדוייקת, ועל הרבה עמודים אני צריך להשתמש עם אופציית יישור הטקסט (באפשרויות התמונה בתוכנה) אחרת יש סטייה של העמודות.

      מצורף קובץ לדוגמה שהורדתי ברשת
      הדוגמה קצת מוגזמת אבל זה בכדי להסביר את הכוונה.



      מקור:
      f46e9731-3a65-468a-9fba-e5331238b6c3-image.png



      תהליך היישור:
      fc50f24c-1791-46d6-8571-99d55c92e1b4-image.png



      לאחר היישור ראו איזה פלא:
      c0cb6e9f-406d-4b19-8af1-f7ba020b2b54-image.png
      קובץ הדוגמה במקור: Name List.pdf




      אשמח לרעיונות כיצד ניתן לקצר את זמן העבודה

      אולי יש תוכנה שיודעת ליישר את הטקסט על הדף באופן אוטומטי?
      אולי יש טריק ב-FineReader שאיני מודע אליו?
      הברקות אחרות?

      תודה רבה!

      WWW תגובה 1 תגובה אחרונה תגובה ציטוט 1
      • WWW
        WWW @בערל נערך לאחרונה על ידי

        @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

        אבל, מפני שהמסך די צפוף בטקסט ובגלל שיש לפעמים סטייה של מילימטרים בזווית הסריקה של המסמך,

        אולי יש תוכנה שיודעת ליישר את הטקסט על הדף באופן אוטומטי?
        אולי יש טריק ב-FineReader שאיני מודע אליו?
        הברקות אחרות?

        אולי לסרוק את הדפים מחדש בסורק מקצועי, ואז הכל יהיה ישר.

        WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

        בערל תגובה 1 תגובה אחרונה תגובה ציטוט 1
        • בערל
          בערל ניהול @WWW נערך לאחרונה על ידי

          @www אמר בעזרה בהמרת דפים סרוקים לאקסל:

          אולי לסרוק את הדפים מחדש בסורק מקצועי, ואז הכל יהיה ישר.

          הסטייה היא במקסימום 2 מילימטר, ובד''כ פחות. יש סורק שיכול להתגבר על זה?

          רחמים WWW 2 תגובות תגובה אחרונה תגובה ציטוט 0
          • רחמים
            רחמים @בערל נערך לאחרונה על ידי

            @בערל זו לא בעיה של סיבוב ימינה ב2 מילימטר, זו בעיה של עיוות פרספקטיבה, זה נראה שסרקו את המסמך עם צלמה שמצלמת ממרחק, ולא עם סורק עם משטח סריקה שמניחים עליו בצורה צמודה את המסמך.

            יעקובוב פיתוח תוכנה ערוץ היוטיוב | אתר

            צפו יוונים נקבצו עלי

            בערל תגובה 1 תגובה אחרונה תגובה ציטוט 3
            • בערל
              בערל ניהול @רחמים נערך לאחרונה על ידי

              @רחמים אמר בעזרה בהמרת דפים סרוקים לאקסל:

              @בערל זו לא בעיה של סיבוב ימינה ב2 מילימטר, זו בעיה של עיוות פרספקטיבה, זה נראה שסרקו את המסמך עם צלמה שמצלמת ממרחק, ולא עם סורק עם משטח סריקה שמניחים עליו בצורה צמודה את המסמך.

              הלכתי על דוגמה קיצונית בשביל להסביר ולהמחיש את העניין (זה מסמך אקראי שמצאתי בגוגל, ודומה למקרה שלי אבל בצורה קיצונית)

              במציאות זה מסמך סרוק דרך מזין של מדפסת איכותית ויש סטייה ממש קטנה בשוליים.

              OdedDvir תגובה 1 תגובה אחרונה תגובה ציטוט 0
              • WWW
                WWW @בערל נערך לאחרונה על ידי

                @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

                הסטייה היא במקסימום 2 מילימטר, ובד''כ פחות. יש סורק שיכול להתגבר על זה?

                מאמין שכן, אין לי ניסיון.

                WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

                תגובה 1 תגובה אחרונה תגובה ציטוט 0
                • OdedDvir
                  OdedDvir @בערל נערך לאחרונה על ידי

                  @בערל אם הסטייה היא בזוית קבועה, אתה יכול ליצור פעולת-אצווה Batch-Action בפוטושופ שתסובב לך את כל התמונות בתיקייה באותה הזוית.

                  בערל 2 תגובות תגובה אחרונה תגובה ציטוט 1
                  • בערל
                    בערל ניהול @OdedDvir נערך לאחרונה על ידי

                    @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                    @בערל אם הסטייה היא בזוית קבועה, אתה יכול ליצור פעולת-אצווה Batch-Action בפוטושופ שתסובב לך את כל התמונות בתיקייה באותה הזוית.

                    בד''כ באותה זווית. אבל:

                    1. זה לא על כל הדפים
                    2. זה לא תמיד באותו גודל
                    3. אפשר לעשות זאת באמצעות FineReader כמו בתמונה למעלה ולהכיל על כל הדפים.
                    תגובה 1 תגובה אחרונה תגובה ציטוט 0
                    • בערל
                      בערל ניהול @OdedDvir נערך לאחרונה על ידי בערל

                      @odeddvir

                      התחלתי באמת להסתכל על כיוון של תוכנות לשיפור תמונות ומצאתי סקריפט של imagemagick שע''פ ההמחשות עושה עבודה מדהימה

                      http://www.fmwconcepts.com/imagemagick/textcleaner/index.php

                      אני מסתבך בהפעלה שלו על ווינדוס. עבדתי לפי ההוראות כאן. לא הבנתי את שלב 4 ואולי זה מה שתוקע אותי.

                      מצורף תמונה של הפלט לאחר ניסיון הרצה:
                      e6581954-7e6c-4380-b51c-f73b0beb9b30-image.png

                      נראה לכם זה הכיוון שיכול לעזור למקרה שלי?
                      אם כן, אעריך מאוד עזרה בהפעלת הסקריפט.

                      OdedDvir תגובה 1 תגובה אחרונה תגובה ציטוט 0
                      • OdedDvir
                        OdedDvir @בערל נערך לאחרונה על ידי

                        @בערל לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש...

                        אבל מצאתי פרוייקט בגיטהב שמתיימר לעשות זאת בהצלחה:
                        https://github.com/JPLeoRX/opencv-text-deskew
                        אין לי פייתון מותקן כרגע כדי לבדוק, אבל זה נראה מאוד מבטיח.

                        בערל yossiz 2 תגובות תגובה אחרונה תגובה ציטוט 1
                        • בערל
                          בערל ניהול @OdedDvir נערך לאחרונה על ידי בערל

                          @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                          @בערל לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש...

                          בדקתי את הארגומנטים הרלוונטיים בדוגמאות שלו, ולא היה נראה לי שצריך להגדיר את גודל הסיבוב והיישור. לכן התלהבתי.

                          @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                          אבל מצאתי פרוייקט בגיטהב שמתיימר לעשות זאת בהצלחה:
                          https://github.com/JPLeoRX/opencv-text-deskew
                          אין לי פייתון מותקן כרגע כדי לבדוק, אבל זה נראה מאוד מבטיח.

                          הורדתי, התקנתי פייתון. מה אני עושה עם זה עכשיו? סליחה על הבורות... לא מצאתי שם פירוט או מדריך שימוש...

                          yossiz תגובה 1 תגובה אחרונה תגובה ציטוט 1
                          • yossiz
                            yossiz @בערל נערך לאחרונה על ידי

                            @בערל תוכנת finereader כבר כוללת זיהוי אוטומטי של סיבוב. אם הזיהוי האטומטי שלהם לא מצליח, האם יש סיבה להאמין שפרוייקט אקראי בגיטהאב יזהה יותר טוב?

                            📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                            בערל תגובה 1 תגובה אחרונה תגובה ציטוט 2
                            • yossiz
                              yossiz @OdedDvir נערך לאחרונה על ידי

                              @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                              לפי הדוגמאות באתר שהבאת לא התרשמתי שהוא מסוגל לזהות את הזווית בעצמו, אלא רק לסובב ולנקות את הרקע לפי ארגומנטים מהמשתמש

                              נראה לי שהוא כן מזהה אוטומטי.
                              (אני לא מאמין שזה יותר טוב מהזיהוי המובנה של ABBYY)

                              אם כבר יש סקריפט יותר טוב שמיועד לשורות טקסט:
                              http://www.fmwconcepts.com/imagemagick/textdeskew/index.php

                              📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                              בערל תגובה 1 תגובה אחרונה תגובה ציטוט 3
                              • OdedDvir
                                OdedDvir נערך לאחרונה על ידי

                                @בערל מצאתי תוכנה בשם Scan-Taylor ל-Windows עם ממשק גרפי, בלי צורך להתקין Python או Bash, ושאר טרחות.
                                הנה קישור לדף גיטהאב עם קובץ בינארי להורדה: https://github.com/scantailor/scantailor/releases/tag/RELEASE_0_9_11_1
                                היא מקבלת TIFF או JPG בלבד. אבל מסוגלת לזהות לבד את הכיוון, ותומכת בטקסט מימין לשמאל.

                                בערל תגובה 1 תגובה אחרונה תגובה ציטוט 4
                                • בערל
                                  בערל ניהול @OdedDvir נערך לאחרונה על ידי

                                  @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                  @בערל מצאתי תוכנה בשם Scan-Taylor ל-Windows עם ממשק גרפי, בלי צורך להתקין Python או Bash, ושאר טרחות.
                                  הנה קישור לדף גיטהאב עם קובץ בינארי להורדה: https://github.com/scantailor/scantailor/releases/tag/RELEASE_0_9_11_1
                                  היא מקבלת TIFF או JPG בלבד. אבל מסוגלת לזהות לבד את הכיוון, ותומכת בטקסט מימין לשמאל.

                                  תודה רבה!

                                  בדקתי וזה עושה עבודה די טובה ומשפרת הרבה!

                                  יש שם אפשרות לזיהוי אוטומטי, אבל, לא מצאתי דרך להגדיר זיהוי אוטומטי לכל התמונות בפרוייקט.
                                  כלומר, יש שם אפשרות להכיל את ההגדרה על כל העמודים אבל אז הוא מכיל את הזווית שנקלטה אוטומטי בעמוד הראשון ולא בודק את כולם ומתאים אישית.
                                  לדוגמה: הראשון זוהה שצריך הטייה של 0.12, השני 0.38, השלישי 0.19
                                  במציאות הוא מכיל על כולם 0.12

                                  ובנוסף, האם יש אפשרות לדלג על ההגדרות הנוספות? של הרזולוציה וכו'.
                                  אני חושב שהוא מזיק לי לאיכות התמונה.

                                  OdedDvir תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                  • בערל
                                    בערל ניהול @yossiz נערך לאחרונה על ידי

                                    @yossiz אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                    @בערל תוכנת finereader כבר כוללת זיהוי אוטומטי של סיבוב. אם הזיהוי האטומטי שלהם לא מצליח,

                                    התמונות שהעליתי למעלה הם אכן לפני עיבוד, והם באמת מצליחים לשפר בהרבה, אבל לא מספיק בכלל.

                                    האם יש סיבה להאמין שפרוייקט אקראי בגיטהאב יזהה יותר טוב?

                                    את זה אני רוצה לבדוק... 🕵 😏

                                    תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                    • בערל
                                      בערל ניהול @yossiz נערך לאחרונה על ידי

                                      @yossiz אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                      אם כבר יש סקריפט יותר טוב שמיועד לשורות טקסט:
                                      http://www.fmwconcepts.com/imagemagick/textdeskew/index.php

                                      אני אשמח מאוד לבדוק אותו, אבל אני מקבל אותו שגיאה כמקודם.

                                      b31dd0fd-9c07-49ba-9835-12cf72b5b5ca-image.png

                                      מה יכול להיות?

                                      תודה רבה

                                      OdedDvir תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                      • OdedDvir
                                        OdedDvir @בערל נערך לאחרונה על ידי OdedDvir

                                        @בערל נסה למקם את קובץ הפלט בתיקייה שאינה root. יש הגבלות על יצירת קבצים בתוך התיקיה הראשית של הכונן.

                                        בערל תגובה 1 תגובה אחרונה תגובה ציטוט 1
                                        • בערל
                                          בערל ניהול @OdedDvir נערך לאחרונה על ידי בערל

                                          @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                          @בערל נסה למקם את הקובץ בתיקייה שאינה root. יש הגבלות על קבצים שנמצאים בתיקיה הראשית של הכונן.

                                          ניסיתי, ראה בתמונה למעלה.
                                          3d5113a2-b404-4398-bfa6-a98fdedb9e75-image.png

                                          רציתי עכשיו שיהיה יותר קריא אז בחרתי בנתיב הקצר ביותר...

                                          תגובה 1 תגובה אחרונה תגובה ציטוט 2
                                          • OdedDvir
                                            OdedDvir @בערל נערך לאחרונה על ידי OdedDvir

                                            @בערל אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                            יש שם אפשרות לזיהוי אוטומטי, אבל, לא מצאתי דרך להגדיר זיהוי אוטומטי לכל התמונות בפרוייקט.

                                            בדוקומנטציה של התוכנה מצויין כי התוכנה באה עם ממשק שורת פקודה, לצורך עבודות אצווה.
                                            כדי להריץ עיבוד על קובץ מסויים, פתח PowerShell, ותריץ כך:

                                            .\scantailor-cli.exe --layout=1 --layout-direction=rl .\scanned\page1.jpg .\output
                                            

                                            וכדי להריץ על כל התמונות בתיקיה scanned תוכל ליצור סקריפט.

                                            ובנוסף, האם יש אפשרות לדלג על ההגדרות הנוספות? של הרזולוציה וכו'.
                                            אני חושב שהוא מזיק לי לאיכות התמונה.

                                            יש אפשרות לציין את ה-DPI של התמונה וכן את מצב הצבע.
                                            תפעיל את scantailor-cli בלי פרמטרים כדי לקבל פירוט של כל אפשרויות הריצה.
                                            אם זה אפשרי, מומלץ כמובן לסרוק את המסמכים בהפרדה גבוהה 600 DPI ובמצב צבעוני או גווני אפור, כדי לקבל תוצאות טובות יותר.

                                            WWW תגובה 1 תגובה אחרונה תגובה ציטוט 2
                                            • WWW
                                              WWW @OdedDvir נערך לאחרונה על ידי WWW

                                              @odeddvir אמר בעזרה בהמרת דפים סרוקים לאקסל:

                                              ובמצב צבעוני או גווני אפור, כדי לקבל תוצאות טובות יותר.

                                              גווני אפור נותן תוצאה יותר טובה למסמכים?

                                              WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

                                              תגובה 1 תגובה אחרונה תגובה ציטוט 0
                                              • 1 / 1
                                              • פוסט ראשון
                                                פוסט אחרון
                                              בא תתחבר לדף היומי!