איך מעתיקים מ PDF ל Word
-
עדכון: אחרי שכתבתי את כל המגילה הארוכה הנ"ל הורדתי שוב את הגירסה האחרונה של תוכנת infix לנסיון
ואני רואה
א) שהתכונה של מיפוי הגופנים עובדת! פלאי פלאים!
ב) גם בגירסת הנסיון זה עובד בלי להוסיף סימן מים לקובץ!אני רואה שיש להם גם אופציה לתיקון אוטומטי באמצעות OCR, אבל זה עובד רק באנגלית
אם כן, זה הפתרון להוריד את גירסת הנסיון של infix.
ואז בתפריט text > remap fonts לתקן את המיפוי, לאשר, ולשמור. -
גילוי אדיר
OCR לעברית עם ניקוד
מעלים לגוגל דרייב>פתח באמצעות>GOOGLEDOCS
קובץ רק עם משקל עד אולי 20 מגה יותר מזה לא עובד (לפחות אצלי)
אם הקובץ הוא בעצם טקסט אז הוא לא עושה OCR אלא סתם מעתיק את הטקטס ואז יהיה לך אותה בעיה. לכן יש להפוך את ה PDF לתמונות בכדי שיבצע OCR ולא רק חילוץ טקטס. איך עושים זאת? עושים הדפסה עם מדפסת PDF שם לבחור (ב ADOBE) מתקדם>הדפסה כתמונה
הקובץ שהוא מייצא בעצם איבד את הטקסט ונהיה תמונות ללא אפשרות העתקה. עכשיו תעלהו באוב אל גוגל דרייב פתח באמצעות גוגל דוקס
ועי' גם פה, ופהוכמה זה עולה כל הסיפור הזה?
0.0 ש"ח -
-
@יוני אמר באיך מעתיקים מ PDF ל Word:
תוכל להראות לי תמונת מסך של מסמך עם בעיה זו
לא רואים כלום בצילום מסך:
אבל כאשר מעתיקים ומדביקים את הטקסט המסומן זה מה שמקבלים:
ÏÏÎ ˜¯Ù ¯Á‡ ˙·ÏÓ ˙·‡ È·‚ ˙Â˘Ï ÂÏ ‰È‰ [‡] .ÛÂÒ·Ï ‰‡ˆÂ‰ È˙˜Â 'ÂΠÈ˙˜ Ì˙‰„ ÔÓ˜Ï Ï„‚
-
@yossiz אמר באיך מעתיקים מ PDF ל Word:
@יוני אמר באיך מעתיקים מ PDF ל Word:
תוכל להראות לי תמונת מסך של מסמך עם בעיה זו
לא רואים כלום בצילום מסך:
אבל כאשר מעתיקים ומדביקים את הטקסט המסומן זה מה שמקבלים:
ÏÏÎ ˜¯Ù ¯Á‡ ˙·ÏÓ ˙·‡ È·‚ ˙Â˘Ï ÂÏ ‰È‰ [‡] .ÛÂÒ·Ï ‰‡ˆÂ‰ È˙˜Â 'ÂΠÈ˙˜ Ì˙‰„ ÔÓ˜Ï Ï„‚
הבנתי, זה מצוי שמעתיקים מPDF שנסגר בתג למשל.
אז מה עושים -
@yossiz אמר באיך מעתיקים מ PDF ל Word:
@יוני הבאתי תמונה למעלה של התוכנה.
התוכנה מביאה לך רשימה של כל הגופנים שיש בקובץ, ולכל גופן הוא מראה לך מפה של כל התווים, אתה עובר עליהם אחד אחד ומכניס את התו הנכון.
זה לוקח 2 דקות. וזה מתקן את כל הקובץ, לא משנה מה גודל הקובץ.הבנתי. למעשה אני לא אראה שום שינוי במסמך כי הרי שהוא מציג אותה זה נראה מצוין רק בהעתקה יש בעיה?
-
@yossiz אמר באיך מעתיקים מ PDF ל Word:
@יוני הבאתי תמונה למעלה של התוכנה.
התוכנה מביאה לך רשימה של כל הגופנים שיש בקובץ, ולכל גופן הוא מראה לך מפה של כל התווים, אתה עובר עליהם אחד אחד ומכניס את התו הנכון.
זה לוקח 2 דקות. וזה מתקן את כל הקובץ, לא משנה מה גודל הקובץ.אבל בשמירה הוא מאיים שהוא יעשה סימון מים ברקע
חוץ מזה גם לפני שמירת הקובץ אני לא מצליח לסמן טקסט להעתקה גם שאני לא לוחץ על ה T שמאפשר לבחור טקסט. הוא רק מסמן לי אות אחת בודדת מבלי אפשרות לבחור אות נוספת -
@yossiz אמר באיך מעתיקים מ PDF ל Word:
@יוני תתעלם מהכל, תבחר Save With Watermark. אח"כ תפתח אותו בתוכנת PDF נורמלית.
מנסיון שלי על אף שהוא מאיים על סימן מים זה איום ריק... (כנראה שסימן המים מופיע רק אם ערכת את ה-PDF ומיפוי תווים לא מזוהה כעריכה).חוץ מזה עכשיו אני רואה שסימון מים עשו בצורה טיפשית (סליחה על המילה) כי זה רק מוסיף למטה תוספת עם לוגו שלהם ואפשר בקלי קלות לקצץ את זה
תראה דוגמא
י.pdf