שיפור בINFIX וייצוא לוורד
-
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
חשבתי שיש דרך משוכללת יותר ואני לא מבין את העניין...
זה היה פתרון לתיקון קידוד ולא דרך לייצא
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
יש הרבה ריבועים ריקים מה צריך לעשות בהם?
כלום
-
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
זה היה פתרון לתיקון קידוד ולא דרך לייצא
יש מטרה נוספת חוץ מייצוא [והדבקה]?
האם ניתן להגיע עם זה ל100 אחוז דיוק?!
ראיתי שהמלצת על axesPDF QuickFix
מה יותר טוב מבין שניהם?
באתר מופיע axesPDF האם זה אותו דבר כמו axesPDF QuickFix ?תודה רבה
-
יש לי חשש שלא הבנת בכלל מה הבעיה שבאתי לפתור עם התוכנה
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
יש מטרה נוספת חוץ מייצוא [והדבקה]?
אולי כן, אולי לא. לא המלצתי על התוכנה לצורך הייצוא עצמו אלא לצורך תיקון הקידוד.
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
האם ניתן להגיע עם זה ל100 אחוז דיוק?!
משמע שלא הבנת את הרעיון. ברור שאפשר להגיע לדיוק של 100%.
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
מה יותר טוב מבין שניהם?
שניהם עובדים, מה שייך פה יותר טוב? axedPDF הוא בתשלום לא זול.
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
באתר מופיע axesPDF האם זה אותו דבר כמו axesPDF QuickFix ?
במשך השנים השם עבר שינוי. אני רואה שגם המחיר השתנה, כבר לא כתוב מחיר, רק לחצן לבקשת הצעת מחיר.
-
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
יש לי חשש שלא הבנת בכלל מה הבעיה שבאתי לפתור עם התוכנה
אני אספר לך את הבעיה שלי ותגיד לי בבקשה אם זה אמור לפתור...:
יש לי ספר עם הרבה עמודים שאני רוצה להמיר אותו לוורד הבעיה היא שבהמרה אני מקבל המון שגיאות- גיבריש, שיבוש מילים, החלפת אותיות ועוד.
זה אמור לטפל בבעיה?@one1010 כתב בשיפור בINFIX וייצוא לוורד:
האם ניתן להגיע עם זה ל100 אחוז דיוק?!
משמע שלא הבנת את הרעיון. ברור שאפשר להגיע לדיוק של 100%.
רציתי להיות בטוח שהבנתי את הרעיון... כי אחרי שהשקעתי זמן ארוך במיפוי עדיין קיבלתי תוצאות מוזרות. לכן אני שואל... עכשיו אני יידע למפות יותר לעומק...
כאילו אחרי המיפוי אין הבדל בין התכונה הזו לתוכנה של רחמים? [חוץ מההבדל הענק ששל רחמים עושה את הכל בצורה אוטומטית כמעט] -
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
זה אמור לטפל בבעיה?
בג'יבריש זה יטפל, בבעיות אחרות לא (לא ברור לי מה זה "שיבוש מילים" ו"החלפת אותיות" האם זה בעיית קידוד או משהו אחר)
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
כאילו אחרי המיפוי אין הבדל בין התכונה הזו לתוכנה של רחמים?
אני לא יודע על איזה תוכנה של רחמים אתה מדבר ומה זה עושה
-
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
זה אמור לטפל בבעיה?
בג'יבריש זה יטפל, בבעיות אחרות לא (לא ברור לי מה זה "שיבוש מילים" ו"החלפת אותיות" האם זה בעיית קידוד או משהו אחר)
החלפת אותיות במקום ג נ במקום ב כ במקום ו ן וכן כיוצא בזה. שיבוש מילים נובע או מהחלפת אותיות או מהדבקת מילים יחד
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
כאילו אחרי המיפוי אין הבדל בין התכונה הזו לתוכנה של רחמים?
אני לא יודע על איזה תוכנה של רחמים אתה מדבר ומה זה עושה
התוכנה שלו לOCR [ראיתי שהתפעלת ממנה כאן בפורום...]
-
אוקיי, סוף סוף הבנתי אותך
אתה מנסה לפתור בעיה אחרת, לזה לא יעזור infix, לא על זה מדובר שם
שם מדובר על קובץ עם תוכן טקסטואלי, ב-PDF זה מוצג נכון, אבל בהעתקה לתוכנה אחרת מקבלים ג'יבריש
אתה מדבר על קובץ עם תוכן תמונה, עשית OCR, וה-OCR לא הצליח. אין לי פתרון לזה חוץ מ-OCR יותר טוב. -
פורמט PDF הוא פורמט משוכלל,
קובץ יכול להכיל טקסט + גופנים מוטמעים. בצורה כזו לא כתוב בקובץ איזה פיקסלים לצבוע שחור ואיזה לצבוע לבן, אלא הוראות יותר כלליות "שים תו X במיקום X Y בגודל N עם פונט X", קובץ כזה אפשר להעתיק ממנו טקסט (על קובץ כזה דיברתי במקרה שהגופן לא מקודד בצורה נכונה ותו X בגופן נראה כאל"ף אבל בערכי יוניקוד הוא תו אחר לגמרי)
קובץ גם יכול להכיל תוכן תמונה שזה סתם מחרוזת ארוכה של ערכי בהירות של CMYK (או RGB) או ערכי בהירות של שחור/לבן של כל פיקסל בתמונה. בצורה כזו גם אם יש טקסט בתוך התמונה לא תוכל להעתיק אותו לקובץ אחר כי מבחינת קורא ה-PDF - שלא חונן במוח אנושי - זה רק פיקסלים
קובץ גם יכול להיות מורכב משני הסוגים ביחד
הפשטתי מאוד אבל זה הרעיוןתוכנת OCR נועד "לקרוא" טקסט מתוך תמונה, כלומר הוא יודע להמיר ערכי פיקסלים לערכי תווים. זה לא עובד בדיוק של 100%. הרבה מהתוכנות מכניסים שוב את הטקסט המזוהה לתוך הPDF כשכבה שקופה על גבי התמונה, כך אתה מקבל אשלייה שאתה יכול לבחור טקסט מתוך התמונה
מה גורם לקובץ PDF להיות טקסטואלי או תמונה?
קובץ שאתה יוצר מתוך תוכנה לעריכת טקסט כמו וורד יקבל תוכן "טקסטואלי"
קובץ מתוך סריקה או מתוך עורך תמונות, יקבל תוכן של תמונה -
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
מה גורם לקובץ PDF להיות טקסטואלי או תמונה?
קובץ שאתה יוצר מתוך תוכנה לעריכת טקסט כמו וורד יקבל תוכן "טקסטואלי"
קובץ מתוך סריקה או מתוך עורך תמונות, יקבל תוכן של תמונהתודה על ההסבר המלומד!
הקובץ המדובר לכאורה לפי ההגדרות שלך אמור להיות טקסטואלי כי הוא לא מגיע מסריקה אלא מסגירת עריכה.
בנוסף אני יכול להעתיק ממנו טקסטים ולערוך אותם בוורד.האם אני צודק? איך ניתן לוודאות את זה?
במידה ואני צודק הפתרון עדיין נמצא בתוכנת COR טובה או עניין של קידוד/בעיה אחרת? כך שלא יעזור לי אפילו תוכנת COR?? -
@one1010 קיבלתי את המייל
נראה שמדובר בקובץ מתוכנת תג
יש שם רק גופן אחד שמקודד בצורה לא נכונה (וילנא,בולד)
ראיתי שתיקון ב-infix לא שומר את התיקון בגוף ה-PDF אלא בקובץ תצורה של התוכנה , לפי מה שזכור לי, פעם זה כן היה מתקן בגוף ה-PDF
חוץ מקידוד לא נכון יש עוד אתגרים בהמרה לוורד. בהמרה המובנה של infix יצא לי הכל הפוך, זה מוזר כי בהמרה ל-html זה יצא טוב יחסית. אבל צריך לשלם להם כדי לקבל המרה בלי איקסים
הייבוא המובנה של וורד יוצא לא רע (אבל גם לא טוב...) -
-
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
@one1010 קיבלתי את המייל
נראה שמדובר בקובץ מתוכנת תגואוו, גם את זה אפשר לראות?! האם ניתן להמיר בחזרה לתג?
יש שם רק גופן אחד שמקודד בצורה לא נכונה (וילנא,בולד)
אז מדוע בINFIX היו לי עשרות אם לא מאות תיקונים?!
ראיתי שתיקון ב-infix לא שומר את התיקון בגוף ה-PDF אלא בקובץ תצורה של התוכנה , לפי מה שזכור לי, פעם זה כן היה מתקן בגוף ה-PDF
שזה אומר מבחינתי? מה אני צריך/יכול לעשות?
חוץ מקידוד לא נכון יש עוד אתגרים בהמרה לוורד. בהמרה המובנה של infix יצא לי הכל הפוך, זה מוזר כי בהמרה ל-html זה יצא טוב יחסית. אבל צריך לשלם להם כדי לקבל המרה בלי איקסים
- יש המרה מובנה לINFIX?
בהעתקה זה לא יוצא הפוך אבל הבעיות עדיין קיימות
הייבוא המובנה של וורד יוצא לא רע (אבל גם לא טוב...)
פחות קריטי לי המבנה. העיקר שהטקסט יהיה מושלם.
תודה רבה!!
- יש המרה מובנה לINFIX?
-
@yossiz כתב בשיפור בINFIX וייצוא לוורד:
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
החלפת אותיות במקום ג נ במקום ב כ במקום ו ן וכן כיוצא בזה
שיבושים של החלפת אותיות דומות קורה רק ב-OCR, עדיין לא ברור לי אם עשית OCR או לא, מדובר בקובץ עם תוכן טקסטואלי,
עשיתי פתיחה של הקובץ בוורד. זה נחשב OCR?
אתה לא אמור לעשות עליו OCR
גם לא יעזור?!
-
@one1010 כתב בשיפור בINFIX וייצוא לוורד:
ואוו, גם את זה אפשר לראות?!
לא, זה היה ניחוש מושכל...
האם ניתן להמיר בחזרה לתג?
לא
אז מדוע בINFIX היו לי עשרות אם לא מאות תיקונים?!
לפעמים זה קורה שגופן אחד מוכפל עשרות פעמים בקובץ, נראה לי שזה קורה אם מדבקים ביחד כמה PDF-ים
(אפשר לתקן את זה בתוכנה שעושה מיטוב PDF)שזה אומר מבחינתי?
שלא יעזור לשמור את הקובץ גם עם סימן מים, צריך לשלם להם כדי לייצא את התוצאה
יש המרה מובנה לINFIX?
כן. file->export
עשיתי פתיחה של הקובץ בוורד. זה נחשב OCR?
לא (אאל"ט, לפעמים וורד כן עושה OCR אם הוא מזהה צורך, אבל במקרה הזה פתחתי את הדף ששלחת לי בוורד וזה נפתח בלי OCR)
אתה לא אמור לעשות עליו OCR
גם לא יעזור?!
אולי זה יכול לעזור קצת, אבל זה גם יזיק כי זה פחות מדוייק מייצוא הטקסט המקורי