דילוג לתוכן
  • דף הבית
  • קטגוריות
  • פוסטים אחרונים
  • משתמשים
  • חיפוש
  • חוקי הפורום
כיווץ
תחומים

תחומים - פורום חרדי מקצועי

💡 רוצה לזכור קריאת שמע בזמן? לחץ כאן!
  1. דף הבית
  2. תכנות
  3. עזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך

עזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך

מתוזמן נעוץ נעול הועבר תכנות
43 פוסטים 9 כותבים 1.9k צפיות 6 עוקבים
  • מהישן לחדש
  • מהחדש לישן
  • הכי הרבה הצבעות
תגובה
  • תגובה כנושא
התחברו כדי לפרסם תגובה
נושא זה נמחק. רק משתמשים עם הרשאות מתאימות יוכלו לצפות בו.
  • רחמיםר רחמים

    @מעלה-ומוריד לא צירפת כלום

    מעלה ומורידמ מנותק
    מעלה ומורידמ מנותק
    מעלה ומוריד
    כתב ב נערך לאחרונה על ידי
    #10

    @רחמים אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

    @מעלה-ומוריד לא צירפת כלום

    תיקנתי (היה חסר https)..

    מנע בזבוז זמן, זכה את הרבים!

    dovidD תגובה 1 תגובה אחרונה
    1
    • מעלה ומורידמ מעלה ומוריד

      @רחמים אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

      @מעלה-ומוריד לא צירפת כלום

      תיקנתי (היה חסר https)..

      dovidD מנותק
      dovidD מנותק
      dovid
      ניהול
      כתב ב נערך לאחרונה על ידי dovid
      #11

      בארגון בו אני עובד בניתי תוכנה קבועה לזה, והיא עובדת ב"ה.
      אבל במקרה אחר בו היא נדרשה היא לא עובדת (בדיוק כמו הקובץ דוגמה שהעלית) הקובץ לא קריא. ניסיתי המון ניסיונות ולא הצלחתי, אני מקוה ש@yossiz יצליח פה ושעל הדרך בעייתי תיפתר גם.

      עריכה:
      אבל פה לפחות את המספרים והמיילים והטלפונים זה מחלץ מצוין. אפשר מזה בטח להגיע לשם התורם...
      אצלי אפילו האנגלית לא קריאה, רק המספרים. טוב אני יחקור שוב עם מה שעשיתי, תודה @מעלה-ומוריד.

      • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
      • בכל נושא אפשר ליצור קשר dovid@tchumim.com
      yossizY תגובה 1 תגובה אחרונה
      3
      • yossizY yossiz

        @מעלה-ומוריד אולי עם קצת מאמץ קבוצתי יוכלו חברי תחומים התותחים למצוא לך פתרון מצויין שתשאיר את חשבון הבנק שלך מעל קו האדום התחתון... 🙂

        ההתחלה:

        • תוכנת pdftotext (הורדה). מריצים את זה ככה:
        pdftotext -enc UTF-8 -layout source-file.pdf -
        

        הנה קבלנו את התוכן של ה-pdf ל-stdout. (הסברים מה זה stdout במדריך שורת הפקודה שלי...)

        • שלב הבא, נמצא regex ששולף את הטקסט הרצוי

        • נרכיב פקודה שעושה שינוי השם לפי התוצאה של הפקודות הנ"ל.

        לפני שנתחיל, בא נחליט באיזה שפה נכתוב את זה?

        לכאורה powershell, למישהו יש הצעה טובה יותר?

        A מנותק
        A מנותק
        aaron
        כתב ב נערך לאחרונה על ידי
        #12

        @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

        לכאורה powershell, למישהו יש הצעה טובה יותר?

        bash? סתם, צוחק.
        נראה לי שהחלק המכאיב זה לבנות regex, מישהו פה התנסה בריג'קס בPS? כי נראה שזה לא תואם..

        aaron.tchumim@gmail.com
        Hetzner - שרתים וירטואליים ופיזיים במחירים מעולים (קישור שותפים)

        ווצאפ API - תיעוד שירות API לא רשמי.

        yossizY תגובה 1 תגובה אחרונה
        0
        • A aaron

          @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

          לכאורה powershell, למישהו יש הצעה טובה יותר?

          bash? סתם, צוחק.
          נראה לי שהחלק המכאיב זה לבנות regex, מישהו פה התנסה בריג'קס בPS? כי נראה שזה לא תואם..

          yossizY מנותק
          yossizY מנותק
          yossiz
          כתב ב נערך לאחרונה על ידי
          #13

          @aaron אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

          bash? סתם, צוחק.

          מה מצחיק? באמת אולי bash היה יותר קל לי, אבל זה לא שימושי ל@מעלה-ומוריד.

          נראה לי שהחלק המכאיב זה לבנות regex, מישהו פה התנסה בריג'קס בPS? כי נראה שזה לא תואם..

          טוב, נצטרך להוכיח לך שאתה לא צודק...
          אולי אתה תרים את הכפפה ותכתוב משהו?

          📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

          A תגובה 1 תגובה אחרונה
          2
          • yossizY yossiz

            @aaron אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

            bash? סתם, צוחק.

            מה מצחיק? באמת אולי bash היה יותר קל לי, אבל זה לא שימושי ל@מעלה-ומוריד.

            נראה לי שהחלק המכאיב זה לבנות regex, מישהו פה התנסה בריג'קס בPS? כי נראה שזה לא תואם..

            טוב, נצטרך להוכיח לך שאתה לא צודק...
            אולי אתה תרים את הכפפה ותכתוב משהו?

            A מנותק
            A מנותק
            aaron
            כתב ב נערך לאחרונה על ידי
            #14

            @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

            טוב, נצטרך להוכיח לך שאתה לא צודק...

            שאני לא צודק במה?
            זה ודאי לא תואם.. נתחיל בזה שאין פלאג של multiline.. כבר כאב ראש..
            (על הדרך גיליתי שיש powershell על דוקר.. אחרת באמת לא היה לי איך לבדוק בכלל)

            aaron.tchumim@gmail.com
            Hetzner - שרתים וירטואליים ופיזיים במחירים מעולים (קישור שותפים)

            ווצאפ API - תיעוד שירות API לא רשמי.

            yossizY תגובה 1 תגובה אחרונה
            0
            • yossizY מנותק
              yossizY מנותק
              yossiz
              כתב ב נערך לאחרונה על ידי yossiz
              #15
              param([string]$path = '.')
              
              $pdftotext = "C:\path\to\pdftotext.exe"
              
              [Console]::OutputEncoding = [text.encoding]::utf8
              
              Get-ChildItem -path $path -Filter '*.pdf' | ForEach-Object -Process {
                $donor = &$pdftotext -enc UTF-8 -simple $_.FullName - | Select-Object -Index 9
                Copy-Item -Path $_.FullName -Destination "$($path)/$($donor.trim()).pdf"
              }
              

              📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

              תגובה 1 תגובה אחרונה
              6
              • dovidD dovid

                בארגון בו אני עובד בניתי תוכנה קבועה לזה, והיא עובדת ב"ה.
                אבל במקרה אחר בו היא נדרשה היא לא עובדת (בדיוק כמו הקובץ דוגמה שהעלית) הקובץ לא קריא. ניסיתי המון ניסיונות ולא הצלחתי, אני מקוה ש@yossiz יצליח פה ושעל הדרך בעייתי תיפתר גם.

                עריכה:
                אבל פה לפחות את המספרים והמיילים והטלפונים זה מחלץ מצוין. אפשר מזה בטח להגיע לשם התורם...
                אצלי אפילו האנגלית לא קריאה, רק המספרים. טוב אני יחקור שוב עם מה שעשיתי, תודה @מעלה-ומוריד.

                yossizY מנותק
                yossizY מנותק
                yossiz
                כתב ב נערך לאחרונה על ידי
                #16

                @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                אצלי אפילו האנגלית לא קריאה, רק המספרים

                מה הסיפור עם הקובץ? נוצרה מאותה תוכנה? הבנת למה אין טקסט?

                📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                dovidD תגובה 1 תגובה אחרונה
                2
                • A aaron

                  @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                  טוב, נצטרך להוכיח לך שאתה לא צודק...

                  שאני לא צודק במה?
                  זה ודאי לא תואם.. נתחיל בזה שאין פלאג של multiline.. כבר כאב ראש..
                  (על הדרך גיליתי שיש powershell על דוקר.. אחרת באמת לא היה לי איך לבדוק בכלל)

                  yossizY מנותק
                  yossizY מנותק
                  yossiz
                  כתב ב נערך לאחרונה על ידי
                  #17

                  @aaron אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                  נתחיל בזה שאין פלאג של multiline

                  פשוט לא נכון. הוצאת שם רע. סביר לטעון שיש טעיות בתכנון של powershell. אבל אל תנסה לטעון שיש טעויות טפשיות שכל מתחיל לא היה עושה.

                  https://stackoverflow.com/a/12573413

                  על הדרך גיליתי שיש powershell על דוקר.. אחרת באמת לא היה לי איך לבדוק בכלל

                  אפשר פשוט להשתמש בווינדוס 🤔 ?
                  בנוסף, מה לא טוב בזה?

                  📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                  yossizY A 2 תגובות תגובה אחרונה
                  4
                  • yossizY yossiz

                    @aaron אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                    נתחיל בזה שאין פלאג של multiline

                    פשוט לא נכון. הוצאת שם רע. סביר לטעון שיש טעיות בתכנון של powershell. אבל אל תנסה לטעון שיש טעויות טפשיות שכל מתחיל לא היה עושה.

                    https://stackoverflow.com/a/12573413

                    על הדרך גיליתי שיש powershell על דוקר.. אחרת באמת לא היה לי איך לבדוק בכלל

                    אפשר פשוט להשתמש בווינדוס 🤔 ?
                    בנוסף, מה לא טוב בזה?

                    yossizY מנותק
                    yossizY מנותק
                    yossiz
                    כתב ב נערך לאחרונה על ידי
                    #18

                    מי שרוצה לתרום עדיין...
                    יש עדיין מה לשפר בסקריפט שכתבתי:

                    • צריך לסנן תווים מיוחדים מתוך השם החדש הקובץ
                    • צריך לתת שם ייחודי לכל קובץ כדי שלא יהיה שגיאה כאשר יש שני קבצים עם שם תורם זהה
                    • צריך לטפל שבהרצה שנייה הסקריפט יתעלם מקבצים שכבר טופלו

                    📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                    OdedDvirO תגובה 1 תגובה אחרונה
                    5
                    • yossizY yossiz

                      @aaron אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                      נתחיל בזה שאין פלאג של multiline

                      פשוט לא נכון. הוצאת שם רע. סביר לטעון שיש טעיות בתכנון של powershell. אבל אל תנסה לטעון שיש טעויות טפשיות שכל מתחיל לא היה עושה.

                      https://stackoverflow.com/a/12573413

                      על הדרך גיליתי שיש powershell על דוקר.. אחרת באמת לא היה לי איך לבדוק בכלל

                      אפשר פשוט להשתמש בווינדוס 🤔 ?
                      בנוסף, מה לא טוב בזה?

                      A מנותק
                      A מנותק
                      aaron
                      כתב ב נערך לאחרונה על ידי aaron
                      #19

                      @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                      פשוט לא נכון. הוצאת שם רע. סביר לטעון שיש טעיות בתכנון של powershell. אבל אל תנסה לטעון שיש טעויות טפשיות שכל מתחיל לא היה עושה.

                      צודק, לא הבדלתי בכך שבמקרה הזה מדובר בקלט מstdout מה שאומר שהוא מסופק כשורות נפרדות ולא כטקסט רציף (עם \n)

                      עריכה: אולי אין קשר..

                      @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                      אפשר פשוט להשתמש בווינדוס ?
                      בנוסף, מה לא טוב בזה?

                      אילו היה וינדוס...
                      ואני משתדל לא להתקין אף פעם ישירות מRPM\DEB. זה מתכון לחבילות לא מעודכנות.. (חוץ מחבילות שכשאתה מתקין הם גם מוסיפות את עצמם לריפו?)
                      בכל מקרה, לא רואה סיבה "לזהם" את הסביבת עבודה כשיש דוקר פשוט וקל..

                      aaron.tchumim@gmail.com
                      Hetzner - שרתים וירטואליים ופיזיים במחירים מעולים (קישור שותפים)

                      ווצאפ API - תיעוד שירות API לא רשמי.

                      תגובה 1 תגובה אחרונה
                      0
                      • yossizY yossiz

                        מי שרוצה לתרום עדיין...
                        יש עדיין מה לשפר בסקריפט שכתבתי:

                        • צריך לסנן תווים מיוחדים מתוך השם החדש הקובץ
                        • צריך לתת שם ייחודי לכל קובץ כדי שלא יהיה שגיאה כאשר יש שני קבצים עם שם תורם זהה
                        • צריך לטפל שבהרצה שנייה הסקריפט יתעלם מקבצים שכבר טופלו
                        OdedDvirO מנותק
                        OdedDvirO מנותק
                        OdedDvir
                        כתב ב נערך לאחרונה על ידי OdedDvir
                        #20

                        @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                        יש עדיין מה לשפר בסקריפט שכתבתי:

                        אני לא מבין בPS אבל הנה השני סנט שלי:

                        צריך לתת שם ייחודי לכל קובץ כדי שלא יהיה שגיאה כאשר יש שני קבצים עם שם תורם זהה

                        לשנות את שם הקובץ המקורי ל: שם המקורי+שם התורם.

                        צריך לטפל שבהרצה שנייה הסקריפט יתעלם מקבצים שכבר טופלו

                        לבדוק אם שם הקובץ גדול מ-10 תווים (ואז הוא טופל)

                        צריך לסנן תווים מיוחדים מתוך השם החדש הקובץ

                        $Path.Split([IO.Path]::GetInvalidFileNameChars()) -join '_'
                        

                        ממיר את כל התווים הלא תקניים לקו תחתון (מקור)

                        ישר כח על העזרה @yossiz !

                        מעלה ומורידמ תגובה 1 תגובה אחרונה
                        7
                        • yossizY yossiz

                          @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                          אצלי אפילו האנגלית לא קריאה, רק המספרים

                          מה הסיפור עם הקובץ? נוצרה מאותה תוכנה? הבנת למה אין טקסט?

                          dovidD מנותק
                          dovidD מנותק
                          dovid
                          ניהול
                          כתב ב נערך לאחרונה על ידי dovid
                          #21

                          @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                          @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                          אצלי אפילו האנגלית לא קריאה, רק המספרים

                          מה הסיפור עם הקובץ? נוצרה מאותה תוכנה? הבנת למה אין טקסט?

                          תוכנה לא מוכרת לי ממקום חיצוני (באופן קבוע).
                          כעת בדקתי שוב, יאהוו כמה ניסיתי אז!
                          הנה רשימה: PdfTextExtractor של iTextSharp, והספריות הבאות בנוד pdf.js-extract, pdf.js, pdf2json, pdfjs-dist, pdfreader.
                          ובכן בשניים כעת בדקתי שוב, והם לא נותנים אפילו ספרה אחת.. כל הטקסט כזה 픀퐀혀ꀀ. אבל כלי שורת הפקודה שהבאת מביא תמיד את כל המספרים טוב, אבל הטקסט בלי utf-8 הוא ריק ועם הוא כזה:
                          ╫¢╫ץ╫ש
                          אני לא יכול לשתף שום מסמך מהסוג הזה, ולצערי לא יכול לייצר דוגמה כי אין לי מושג מי התוכנה המייצרת... אדובי רידר מבין את הטקסט נהדר.

                          @מעלה-ומוריד תודה על הנושא, סליחה על הרכיבה על הנושא שאני עצמי לא סובל שאחרים עושים. הרשיתי לעצמי כי בעצם הפתרון ש@yossiz הביא מצויין, הבעיות שלו עם השם קובץ ועם הפעם השניה לדעתי לא באמת יטרידו אותך.

                          • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                          • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                          מעלה ומורידמ yossizY 2 תגובות תגובה אחרונה
                          6
                          • dovidD dovid

                            @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                            @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                            אצלי אפילו האנגלית לא קריאה, רק המספרים

                            מה הסיפור עם הקובץ? נוצרה מאותה תוכנה? הבנת למה אין טקסט?

                            תוכנה לא מוכרת לי ממקום חיצוני (באופן קבוע).
                            כעת בדקתי שוב, יאהוו כמה ניסיתי אז!
                            הנה רשימה: PdfTextExtractor של iTextSharp, והספריות הבאות בנוד pdf.js-extract, pdf.js, pdf2json, pdfjs-dist, pdfreader.
                            ובכן בשניים כעת בדקתי שוב, והם לא נותנים אפילו ספרה אחת.. כל הטקסט כזה 픀퐀혀ꀀ. אבל כלי שורת הפקודה שהבאת מביא תמיד את כל המספרים טוב, אבל הטקסט בלי utf-8 הוא ריק ועם הוא כזה:
                            ╫¢╫ץ╫ש
                            אני לא יכול לשתף שום מסמך מהסוג הזה, ולצערי לא יכול לייצר דוגמה כי אין לי מושג מי התוכנה המייצרת... אדובי רידר מבין את הטקסט נהדר.

                            @מעלה-ומוריד תודה על הנושא, סליחה על הרכיבה על הנושא שאני עצמי לא סובל שאחרים עושים. הרשיתי לעצמי כי בעצם הפתרון ש@yossiz הביא מצויין, הבעיות שלו עם השם קובץ ועם הפעם השניה לדעתי לא באמת יטרידו אותך.

                            מעלה ומורידמ מנותק
                            מעלה ומורידמ מנותק
                            מעלה ומוריד
                            כתב ב נערך לאחרונה על ידי
                            #22

                            @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                            סליחה על הרכיבה

                            בסגר דמור. אם המנהל ישאל אותי אני אגיד לו שלא ימחק אותך

                            @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                            הבעיות שלו עם השם קובץ ועם הפעם השניה לדעתי לא באמת יטרידו אותך.

                            הבעיות שלו הגיעו מהנסיון אצלי...
                            הכריש שאתם רואים מלפני הקלעים. מאחוריהם הוא דג זהב שלא גומר לעזור לאנשים. ועד הסוף.

                            מנע בזבוז זמן, זכה את הרבים!

                            yossizY תגובה 1 תגובה אחרונה
                            6
                            • מעלה ומורידמ מעלה ומוריד

                              @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                              סליחה על הרכיבה

                              בסגר דמור. אם המנהל ישאל אותי אני אגיד לו שלא ימחק אותך

                              @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                              הבעיות שלו עם השם קובץ ועם הפעם השניה לדעתי לא באמת יטרידו אותך.

                              הבעיות שלו הגיעו מהנסיון אצלי...
                              הכריש שאתם רואים מלפני הקלעים. מאחוריהם הוא דג זהב שלא גומר לעזור לאנשים. ועד הסוף.

                              yossizY מנותק
                              yossizY מנותק
                              yossiz
                              כתב ב נערך לאחרונה על ידי
                              #23

                              @מעלה-ומוריד אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                              הכריש שאתם רואים מלפני הקלעים. מאחוריהם הוא דג זהב שלא גומר לעזור לאנשים. ועד הסוף.

                              אופסס... אבק לשון הרע... 🤐
                              (אגב, אם כבר הזכרת, אני מעדיף ככל שאפשר לעזור מעל גבי הפורום ולא בפרטי, כי ככה אני מקבל מתן שכרה בצידה של אינטראקציה עם שאר חברי הקהילה החמודה שלנו, עזרה ורעיונות של אחרים וכו' בקיצור כל מה שאני אוהב בתחומים, וגם יש גבול כמה אפשר לנדנד דרך הפורום, בניגוד להתכתבות אישית..., כמובן יש דברים שלא ראוי או שלא יעיל ולא מועיל לעשות דרך הפורום)

                              📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                              תגובה 1 תגובה אחרונה
                              8
                              • dovidD dovid

                                @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                אצלי אפילו האנגלית לא קריאה, רק המספרים

                                מה הסיפור עם הקובץ? נוצרה מאותה תוכנה? הבנת למה אין טקסט?

                                תוכנה לא מוכרת לי ממקום חיצוני (באופן קבוע).
                                כעת בדקתי שוב, יאהוו כמה ניסיתי אז!
                                הנה רשימה: PdfTextExtractor של iTextSharp, והספריות הבאות בנוד pdf.js-extract, pdf.js, pdf2json, pdfjs-dist, pdfreader.
                                ובכן בשניים כעת בדקתי שוב, והם לא נותנים אפילו ספרה אחת.. כל הטקסט כזה 픀퐀혀ꀀ. אבל כלי שורת הפקודה שהבאת מביא תמיד את כל המספרים טוב, אבל הטקסט בלי utf-8 הוא ריק ועם הוא כזה:
                                ╫¢╫ץ╫ש
                                אני לא יכול לשתף שום מסמך מהסוג הזה, ולצערי לא יכול לייצר דוגמה כי אין לי מושג מי התוכנה המייצרת... אדובי רידר מבין את הטקסט נהדר.

                                @מעלה-ומוריד תודה על הנושא, סליחה על הרכיבה על הנושא שאני עצמי לא סובל שאחרים עושים. הרשיתי לעצמי כי בעצם הפתרון ש@yossiz הביא מצויין, הבעיות שלו עם השם קובץ ועם הפעם השניה לדעתי לא באמת יטרידו אותך.

                                yossizY מנותק
                                yossizY מנותק
                                yossiz
                                כתב ב נערך לאחרונה על ידי yossiz
                                #24

                                @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                הנה רשימה: PdfTextExtractor של iTextSharp, והספריות הבאות בנוד pdf.js-extract, pdf.js, pdf2json, pdfjs-dist, pdfreader.

                                מסתבר שיש לנו דרכי פעולה שונות...
                                הדבר הראשון שהייתי עושה לפני נסיון דרך כל ספרייה שזזה הוא לפתוח את ה-PDF ברנטגן של PDF-ים.
                                יש כמה תוכנות כאלו, התוכנה האהובה עלי כרגע הוא: https://pdfbox.apache.org/1.8/commandline.html#pdfdebugger
                                ממש פותח צוהר לתוך המבנה של ה-PDF.
                                כמובן שצריך להחזיק קרוב אליך את ה"מדריך למשתמש (המתקדם?)" של PDF. ספר בן 1300 עמודים...

                                ובכן בשניים כעת בדקתי שוב, והם לא נותנים אפילו ספרה אחת.. כל הטקסט כזה 픀퐀혀ꀀ. אבל כלי שורת הפקודה שהבאת מביא תמיד את כל המספרים טוב, אבל הטקסט בלי utf-8 הוא ריק ועם הוא כזה:

                                ╫¢╫ץ╫ש

                                אם כן תריץ chcp 65001 לפני הפקודה ותמצא נחת. (עובד ב-CMD)
                                או ב-powershell:

                                [System.Console]::OutputEncoding = [System.Text.Encoding]::UTF8
                                

                                📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                                dovidD תגובה 1 תגובה אחרונה
                                6
                                • yossizY yossiz

                                  @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                  הנה רשימה: PdfTextExtractor של iTextSharp, והספריות הבאות בנוד pdf.js-extract, pdf.js, pdf2json, pdfjs-dist, pdfreader.

                                  מסתבר שיש לנו דרכי פעולה שונות...
                                  הדבר הראשון שהייתי עושה לפני נסיון דרך כל ספרייה שזזה הוא לפתוח את ה-PDF ברנטגן של PDF-ים.
                                  יש כמה תוכנות כאלו, התוכנה האהובה עלי כרגע הוא: https://pdfbox.apache.org/1.8/commandline.html#pdfdebugger
                                  ממש פותח צוהר לתוך המבנה של ה-PDF.
                                  כמובן שצריך להחזיק קרוב אליך את ה"מדריך למשתמש (המתקדם?)" של PDF. ספר בן 1300 עמודים...

                                  ובכן בשניים כעת בדקתי שוב, והם לא נותנים אפילו ספרה אחת.. כל הטקסט כזה 픀퐀혀ꀀ. אבל כלי שורת הפקודה שהבאת מביא תמיד את כל המספרים טוב, אבל הטקסט בלי utf-8 הוא ריק ועם הוא כזה:

                                  ╫¢╫ץ╫ש

                                  אם כן תריץ chcp 65001 לפני הפקודה ותמצא נחת. (עובד ב-CMD)
                                  או ב-powershell:

                                  [System.Console]::OutputEncoding = [System.Text.Encoding]::UTF8
                                  
                                  dovidD מנותק
                                  dovidD מנותק
                                  dovid
                                  ניהול
                                  כתב ב נערך לאחרונה על ידי
                                  #25

                                  @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                  מסתבר שיש לנו דרכי פעולה שונות...

                                  ללא ספק...

                                  אם כן תריץ chcp 65001 לפני הפקודה ותמצא נחת. (עובד ב-CMD)
                                  או ב-powershell:

                                  [System.Console]::OutputEncoding = [System.Text.Encoding]::UTF8
                                  

                                  אכן!! אבל למה בC# ובנוד לא הצלחתי בשום קידוד? מאה תודות!

                                  • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                                  • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                                  yossizY תגובה 1 תגובה אחרונה
                                  5
                                  • dovidD dovid

                                    @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                    מסתבר שיש לנו דרכי פעולה שונות...

                                    ללא ספק...

                                    אם כן תריץ chcp 65001 לפני הפקודה ותמצא נחת. (עובד ב-CMD)
                                    או ב-powershell:

                                    [System.Console]::OutputEncoding = [System.Text.Encoding]::UTF8
                                    

                                    אכן!! אבל למה בC# ובנוד לא הצלחתי בשום קידוד? מאה תודות!

                                    yossizY מנותק
                                    yossizY מנותק
                                    yossiz
                                    כתב ב נערך לאחרונה על ידי
                                    #26

                                    @dovid אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                    אבל למה בC# ובנוד לא הצלחתי בשום קידוד

                                    קשה לענות על זה בלי שתשתף קובץ

                                    📧 יוסי@מייל.קום | 🌎 בלוג | ☕ קפה

                                    תגובה 1 תגובה אחרונה
                                    4
                                    • מעלה ומורידמ מנותק
                                      מעלה ומורידמ מנותק
                                      מעלה ומוריד
                                      כתב ב נערך לאחרונה על ידי
                                      #27

                                      @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                      • צריך לתת שם ייחודי לכל קובץ כדי שלא יהיה שגיאה כאשר יש שני קבצים עם שם תורם זהה

                                      הסקריפט לא משנה את שם המסמך אלא משכפל אותו עם השם הרצוי, מה שיכול לגרום לכך שאם יתוקן, הסקריפט ירוץ בלי להפסיק, כיוון שתמיד ישארו קבצים לא מטופלים.

                                      מנע בזבוז זמן, זכה את הרבים!

                                      dovidD תגובה 1 תגובה אחרונה
                                      2
                                      • מעלה ומורידמ מעלה ומוריד

                                        @yossiz אמר בעזרה - שינוי שם בקבצי PDF מרובים לפי טקסט מתוך המסמך:

                                        • צריך לתת שם ייחודי לכל קובץ כדי שלא יהיה שגיאה כאשר יש שני קבצים עם שם תורם זהה

                                        הסקריפט לא משנה את שם המסמך אלא משכפל אותו עם השם הרצוי, מה שיכול לגרום לכך שאם יתוקן, הסקריפט ירוץ בלי להפסיק, כיוון שתמיד ישארו קבצים לא מטופלים.

                                        dovidD מנותק
                                        dovidD מנותק
                                        dovid
                                        ניהול
                                        כתב ב נערך לאחרונה על ידי
                                        #28

                                        @מעלה-ומוריד צריך להחליף את Copy-Item לMove-Item.

                                        • מנטור אישי בתכנות והמסתעף – להתקדם לשלב הבא!
                                        • בכל נושא אפשר ליצור קשר dovid@tchumim.com
                                        מלאמ chvC 2 תגובות תגובה אחרונה
                                        1
                                        • dovidD dovid

                                          @מעלה-ומוריד צריך להחליף את Copy-Item לMove-Item.

                                          מלאמ מנותק
                                          מלאמ מנותק
                                          מלא
                                          כתב ב נערך לאחרונה על ידי מלא
                                          #29

                                          @מעלה-ומוריד

                                          אפשר להוסיף מספור-רץ לשם הקובץ,
                                          ועם המספור גם להגביל את הריצה לפי מספר הקבצים שהיו בהפעלה.

                                          מעלה ומורידמ תגובה 1 תגובה אחרונה
                                          1
                                          תגובה
                                          • תגובה כנושא
                                          התחברו כדי לפרסם תגובה
                                          • מהישן לחדש
                                          • מהחדש לישן
                                          • הכי הרבה הצבעות


                                          • 1
                                          • 2
                                          • 3
                                          בא תתחבר לדף היומי!
                                          • התחברות

                                          • אין לך חשבון עדיין? הרשמה

                                          • התחברו או הירשמו כדי לחפש.
                                          • פוסט ראשון
                                            פוסט אחרון
                                          0
                                          • דף הבית
                                          • קטגוריות
                                          • פוסטים אחרונים
                                          • משתמשים
                                          • חיפוש
                                          • חוקי הפורום