דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. זיהוי ושינוי קידוד טקסט בקובץ PDF

זיהוי ושינוי קידוד טקסט בקובץ PDF

מתוזמן נעוץ נעול הועבר תכנות
5 פוסטים 3 כותבים 498 צפיות
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • Y מנותק
    Y מנותק
    yits
    כתב ב נערך לאחרונה על ידי
    #1

    יש לי קבצי PDF שלא ניתן לעשות בהם חיפוש למרות שהקובץ נסגר עם פונטים מוטמעים,
    הבעיה היא דווקא בפונטים עבריים ואולי בגלל שזה נסגר בתוכנות אדובי במחשב mac.

    לדוגמא "מחכה עד שיגדל" נקלט בפעולת העתקת טקסט כ

    Ï„‚È˘ „Ú ‰ÎÁÓ
    

    ניתן כמובן לנתח את הקידוד באתר הזה https://www.online-decoder.com/he/

    האם יש דרך להמיר קידוד של טקסט בקבצי PDF (ללא ביצוע OCR) באמצעות קוד פייתון או בכל אפשרות אחרת

    קישור לקובץ עם הבעיה המדוברת:

    דוגמאות נוספות: דוגמא 2 דוגמא 3

    לקניה והנחות ב KSP כנסו מכאן.
    למוצרים עם הנחה מכאן.

    אלף שיןא 2 תגובות תגובה אחרונה
    0
    • yossizY מנותק
      yossizY מנותק
      yossiz
      כתב ב נערך לאחרונה על ידי yossiz
      #2

      @yits כבר שנים על גבי שנים שיש לי מחשבה לכתוב תוכנה לסדר קבצים כאלו
      זה בטח אפשרי באמצעות קוד אבל זה לא ענין של שתי שורות

      אני מכיר שתי תוכנות קיימות שיודעים לסדר את זה אבל שניהם בתשלום
      א) https://www.iceni.com/infix.htm
      בגירסת הנסיון הוא מוסיף סימן מים
      כתבתי פעם סקריפט להסרת סימן המים
      ב) https://www.axes4.com/en/software-services/axespdf
      זה כלי יקר ובגירסת הנסיון הוא צובע חלקים אקראיים של ה-PDF בירוק, קשה מאוד לתקן את זה על ידי סקריפט
      (הצלחתי לעקוף את זה על ידי ריצה באמצעות דיבאגר ועקיפת בדיקת הרשיון אבל זה לא שווה לכל נפש...)

      בשתי התוכנות צריך לסדר את זה ידנית, להגיד לתוכנה על כל אות של כל פונט מה הוא
      עקרונית היה אפשר להוסיף אוטומציה חלקית

      📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

      Y תגובה 1 תגובה אחרונה
      4
      • dovidD מנותק
        dovidD מנותק
        dovid ניהול
        כתב ב נערך לאחרונה על ידי
        #3

        @yossiz מכל האפשרויות הכי פשוט זה לקנות, זה נראה שנקודת המוצא שלך היא שאנשים יעדיפו לטפס על גורד שחקים מלשלם 300 שקל לתוכנה טובה (וכנראה שאתה צודק לגבי הרבה...).
        אז אם ככה אעיז לבקש ממך שתיתן חוו"ד על השוואת שניהם מבחינת עלות/תועלת.

        מנטור אישי למתכנתים (ולא רק) – להתקדם לשלב הבא!

        בכל נושא אפשר ליצור קשר dovid@tchumim.com

        yossizY תגובה 1 תגובה אחרונה
        2
        • yossizY מנותק
          yossizY מנותק
          yossiz
          השיב לdovid ב נערך לאחרונה על ידי yossiz
          #4

          @dovid במקרה הזה לא הייתי ממליץ לשלם על התוכנות. שניהם לא מספיק כדאיים. שניהם במינוי חודשי/שנתי והמענה שהם נותנים לא מושלם, זה עדיין מצריך עבודה ידנית (התכונה הזאת הוא רק חלק שולי מהתוכנה)
          axesPDF הוא בתשלום של 650 דולר לשנה - מן הסתם לא בא בחשבון
          infix במחיר יותר הגיוני של 9.99 דולר לחודש - זה יכול להיות כדאי לצורך חד פעמי. לא כדאי לשלם מינוי תמידי רק עבור תכונה זו. (מה עוד שהבאתי כלי להסיר את סימן המים של גירסת הנסיון)

          📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

          תגובה 1 תגובה אחרונה
          3
          • Y מנותק
            Y מנותק
            yits
            השיב לyossiz ב נערך לאחרונה על ידי yits
            #5

            @yossiz כתב בזיהוי ושינוי קידוד טקסט בקובץ PDF:

            @yits כבר שנים על גבי שנים שיש לי מחשבה לכתוב תוכנה לסדר קבצים כאלו
            זה בטח אפשרי באמצעות קוד אבל זה לא ענין של שתי שורות

            ניסיתי קצת לחקור את המבנה של קבצי PDF בשביל לתקן את הבעיה,
            לפי מה שנראה לי הבעיה נמצאת בפונטים המוטמעים שהם מצביעים על מס' אקסדצימלי שגוי
            אולי אני טועה.

            לכן חשבתי שצריך לבנות קובץ שמחלץ את הפונטים האלו ומבצע החלפה לפי מפת תווים אחרת

            לקניה והנחות ב KSP כנסו מכאן.
            למוצרים עם הנחה מכאן.

            תגובה 1 תגובה אחרונה
            1
            • dovidD dovid פיצל נושא זה ב

            בא תתחבר לדף היומי!
            • התחברות

            • אין לך חשבון עדיין? הרשמה

            • התחברו או הירשמו כדי לחפש.
            • פוסט ראשון
              פוסט אחרון
            0
            • דף הבית
            • קטגוריות
            • פוסטים אחרונים
            • משתמשים
            • חיפוש
            • חוקי הפורום