דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תוכנה
  3. איך מעתיקים מ PDF ל Word

איך מעתיקים מ PDF ל Word

מתוזמן נעוץ נעול הועבר תוכנה
39 פוסטים 5 כותבים 5.0k צפיות 3 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • yossizY yossiz

    @נתן אמר באיך מעתיקים מ PDF ל Word:

    יש דרך להתגבר על זה?

    לא בחינם. (למרות שאם אתה ממש מתעקש כמוני תצליח...). ראה בפוסט הבא

    תיאור הבעיה

    הבעיה היא שהגופנים לא מקודדים נכון.
    וביתר פירוט,
    בד"כ, דהיינו בפורמטים של קבצים שניתנים לעריכה, הטקסט של הקובץ מקודד כמספרים, (א=1488, ב=1499 וכו' זה ב-unicode, יש כמה קידודים, אבל הכי טוב הוא יוניקוד.)
    איך התוכנה יודעת איזה צורה להציג עבור כל מספר? המידע הזאת מקודד בגופן. כלומר, בתוך הגופן נמצא מפה שממפה את המספר 1488 לצורת האות א' וכו' על זה הדרך לכל התווים שהגופן תומך בהם.
    בפורמט PDF לעמות זאת, זה הולך הפוך, הטקסט מקודד כרצף של מזהי גליפים (גליפים=צורות שנמצאים בתוך הגופן) ולא במספרי תווים (זה מוודא שהתוכן יוצג נכון גם אם הגופן לא מקודד נכון). ואז כדי להעתיק את זה עבור תוכנות אחרות, קורא ה-PDF מנסה להמיר את זה חזרה למספרי תווים באמצעות המיפוי הנ"ל שבתוך הגופן (ב-PDF בד"כ הגופן מוטמע בתוך הקובץ, לא מדובר בגופן שמותקן במערכת).
    הבעיה היא שיש גופנים עם מיפוי לא תקני, ויש מייצרי PDF שלא מטמיעים את המיפוי הנכון.

    פתרונות

    בעבר ישבתי שעות על גבי שעות לנסות למצוא פתרון לבעיה.
    בעצם הפתרון אמור להיות תוכנה שיציג למשתמש את מפת התווים של כל הגופנים שמוטמעים ב-PDF והמשתמש יכניס את המיפוי הנכון שאותו התוכנה יטמיע בגופן.
    יש שתי רעיונות לשפר את השימוש בתוכנה (התיאורטית):

    • שבתוך התוכנה יהיו מוטמעים מפויים (לא תקניים) מצויים, והתוכנה יציע למשתמש להשתמש באחד מהמיפויים שכבר הוגדרו
    • שהתוכנה ינסה לזהות בעצמו את המיפוי הנכון על ידי OCR, ויישאר למשתמש רק לאמת את הזיהוי

    הבעיה היא שאין תוכנה כזאת בשוק שהוא בהישג יד כל אחד ואחד 😞
    דיברתי עם ABBYY שיוסיפו את זה לתוכנה שלהם (ABBYY FineReader), אבל אחרי הרבה הלוך ושוב, התמיכה המטומטמת שלהם עדיין לא הבינו מה אני רוצה מחייהם...

    יש אומנם שתי תוכנות שכן מציעים תכונה זאת:

    • infix -הבעיות הם א) זה רק בתשלום ב) פעם העבר שניסיתי אותה (בסוף 2017) התכונה הזאת לא עבדה 😞 (דיווחתי להם והם טענו שזה יתוקן - לא בדקתי שוב)
      0863a95a-0dac-453b-a3f6-c81921a07a99-image.png

    • axesPDF QuickFix
      ac20b622-0f79-422b-ba01-ddfbf6faba31-image.png
      זה תוכנה מצויינת אבל עולה הרבה 😞
      (אני פרצתי את התוכנה עבור עצמי וכך הצלחתי לתקן כמה PDF-ים משובשים... אבל זה לא להפצה)

    יש לי חלום של שנים לכתוב תוכנה כזאת אבל זה עדיין רק חלום...

    נראה לי שיש ל @רחמים עוד מה לתרום לנושא. (אתה נפגשת בבעיה הזאת בתוכנת החיפוש שלך, לא?)

    WWWW מנותק
    WWWW מנותק
    WWW
    כתב ב נערך לאחרונה על ידי
    #30

    @yossiz אמר באיך מעתיקים מ PDF ל Word:

    נראה לי שיש ל @רחמים עוד מה לתרום לנושא. (אתה נפגשת בבעיה הזאת בתוכנת החיפוש שלך, לא?)

    אאל"ט הוא כתב בתחומים שהוא מימש את המפה לבד, כנראה משהו כעין מה שכתבת.

    WWW.netfree@gmail.com || קשבק! החזר כספי לבנק על רכישות באינטרנט || עונים על סקרים ומרוויחים כסף!

    תגובה 1 תגובה אחרונה
    0
    • yossizY yossiz

      @יוני גם אני לא מצליח עם הקובץ שהעלת... לא יודע מה ההבדל
      כנראה התוכנה לא ידעת לטפל בגופנים type1

      י מנותק
      י מנותק
      יוני
      כתב ב נערך לאחרונה על ידי
      #31

      @yossiz אמר באיך מעתיקים מ PDF ל Word:

      @יוני גם אני לא מצליח עם הקובץ שהעלת... לא יודע מה ההבדל
      כנראה התוכנה לא ידעת לטפל בגופנים type1

      מצאתי דרך גם עם תוכנה זו (Infix)
      אמנם לא הכי נח אבל עובד

      yossizY תגובה 1 תגובה אחרונה
      0
      • י יוני

        @yossiz אמר באיך מעתיקים מ PDF ל Word:

        @יוני גם אני לא מצליח עם הקובץ שהעלת... לא יודע מה ההבדל
        כנראה התוכנה לא ידעת לטפל בגופנים type1

        מצאתי דרך גם עם תוכנה זו (Infix)
        אמנם לא הכי נח אבל עובד

        yossizY מנותק
        yossizY מנותק
        yossiz
        כתב ב נערך לאחרונה על ידי
        #32

        @יוני אמר באיך מעתיקים מ PDF ל Word:

        מצאתי דרך גם עם תוכנה זו (Infix)

        שתף אותנו בבקשה

        📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

        י תגובה 1 תגובה אחרונה
        0
        • י יוני

          @נתן אמר באיך מעתיקים מ PDF ל Word:

          הפתרון של @יוני הרבה יותר פשוט ונוח לפי דעתי. עשיתי על ספר 300 עמודים וזה עובד להפליא משא"כ בתוכנה ש @yossiz הביא זה הרבה עבודה לסדר את המיפוי אבל יתכן שהוא יותר מדויק!?

          אבל אל תאמין לדרייב, יש לו הרבה שיבושים בפענוח הניקוד - תבדוק אחריו!

          נתןנ מנותק
          נתןנ מנותק
          נתן
          כתב ב נערך לאחרונה על ידי
          #33

          @יוני אמר באיך מעתיקים מ PDF ל Word:

          @נתן אמר באיך מעתיקים מ PDF ל Word:

          הפתרון של @יוני הרבה יותר פשוט ונוח לפי דעתי. עשיתי על ספר 300 עמודים וזה עובד להפליא משא"כ בתוכנה ש @yossiz הביא זה הרבה עבודה לסדר את המיפוי אבל יתכן שהוא יותר מדויק!?

          אבל אל תאמין לדרייב, יש לו הרבה שיבושים בפענוח הניקוד - תבדוק אחריו!

          צודק עכשיו אני רואה שהוא עושה מלא טעיות

          תגובה 1 תגובה אחרונה
          0
          • yossizY yossiz

            @יוני אמר באיך מעתיקים מ PDF ל Word:

            מצאתי דרך גם עם תוכנה זו (Infix)

            שתף אותנו בבקשה

            י מנותק
            י מנותק
            יוני
            כתב ב נערך לאחרונה על ידי
            #34

            @yossiz אמר באיך מעתיקים מ PDF ל Word:

            @יוני אמר באיך מעתיקים מ PDF ל Word:

            מצאתי דרך גם עם תוכנה זו (Infix)

            שתף אותנו בבקשה

            זה היה טעות, כי מה שעשיתי בעצם זה EXPORT אבל בפועל הוא לא הצליח לייצא רק עם מלא קודים חוץ מהטקסט הטוב
            עשיתי בתפריט

            translate
            local
            export
            plain text
            ok

            אולי תוכל למצוא דרך לייצא או לפחות אפשרות העתקה

            תגובה 1 תגובה אחרונה
            1
            • י מנותק
              י מנותק
              יוני
              כתב ב נערך לאחרונה על ידי
              #35

              מישהו ביקש לחלץ מכאן עם הניקוד מתוקן בלי שיבושים
              @yossiz אפשרי בתוכנות שלך?

              2.pdf

              תגובה 1 תגובה אחרונה
              0
              • י מנותק
                י מנותק
                יוני
                כתב ב נערך לאחרונה על ידי
                #36

                הצלחתי לחלץ רגיל [ע"י בחר הכל העתק הדבק לוורד] והחלפתי כל סגול (שהיה משובש כזה:2020-01-14_162745.png עם רווח. אבל עדיין זה נראה ככה כמצורף עם מלא רווחים בתוך מילה ולכן אין פקודה פשוטה של מצא והחלף לתקן הכל בקל. עזרה בבקשה
                1.docx

                תגובה 1 תגובה אחרונה
                0
                • נתןנ מנותק
                  נתןנ מנותק
                  נתן
                  כתב ב נערך לאחרונה על ידי נתן
                  #37

                  מה הפיתרון?@yossiz

                  תגובה 1 תגובה אחרונה
                  0
                  • י מנותק
                    י מנותק
                    יוני
                    כתב ב נערך לאחרונה על ידי
                    #38

                    @יוני אמר באיך מעתיקים מ PDF ל Word:

                    מישהו ביקש לחלץ מכאן עם הניקוד מתוקן בלי שיבושים
                    @yossiz אפשרי בתוכנות שלך?

                    2.pdf

                    מישהו

                    תגובה 1 תגובה אחרונה
                    0
                    • yossizY מנותק
                      yossizY מנותק
                      yossiz
                      כתב ב נערך לאחרונה על ידי
                      #39

                      @יוני נסיתי ולא הצלחתי 😞 זה לא (רק) בעיית קידוד.

                      📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                      תגובה 1 תגובה אחרונה
                      0
                      תגובה
                      • תגובה כנושא
                      התחברו כדי לפרסם תגובה
                      • מהישן לחדש
                      • מהחדש לישן
                      • הכי הרבה הצבעות


                      • 1
                      • 2
                      בא תתחבר לדף היומי!
                      • התחברות

                      • אין לך חשבון עדיין? הרשמה

                      • התחברו או הירשמו כדי לחפש.
                      • פוסט ראשון
                        פוסט אחרון
                      0
                      • דף הבית
                      • קטגוריות
                      • פוסטים אחרונים
                      • משתמשים
                      • חיפוש
                      • חוקי הפורום