חילוץ טקסט מ PDF גיבריש
-
כהמשך לאכול שנכתב בסמוך
http://code.613m.org/viewtopic.php?f=1&t=34&start=10#p2853האם יש לכם עצה ופתרון איך שולפים טקסט מ-PDF שהוא גיבריש והופכים אותו לעברית?
פורסם במקור בפורום CODE613 ב22/10/2015 11:29 (+03:00)
-
אולי הבעיה בפונט?
https://www.adobe.com/support/downloads/detail.jsp?ftpID=5508פורסם במקור בפורום CODE613 ב22/10/2015 12:27 (+03:00)
-
תעשה מיפוי.
למשל
[size=150:21m0bmnf]
í = ה
ê = א
[/size:21m0bmnf]פורסם במקור בפורום CODE613 ב22/10/2015 14:20 (+03:00)
-
זה לא בדיוק נכון, כי יש עוד סוגי גיבריש.
פורסם במקור בפורום CODE613 ב22/10/2015 14:21 (+03:00)
-
תעשה מיפוי.
למשל
[size=150:1xz5imq8]
í = ה
ê = א
[/size:1xz5imq8]כך לדוג' את זה
ê האות הזאת משמשת למשהו אחר
פורסם במקור בפורום CODE613 ב22/10/2015 14:24 (+03:00)
-
אני מניח שהוא התכוון לדוגמה, אני לא בטוח שיש כמה סוגי ג'יבריש על אותם תווים.
צריך לבדוק איך הם עושים את זה, ככל הידוע לי פעם הם מכרו DLL
http://www.pixiesoft.com/flipפורסם במקור בפורום CODE613 ב22/10/2015 15:35 (+03:00)
-
פשוט מאוד
תכין טבלה
תדפיס א-ת
ותראה מה הוא מכניסזה מה שרחמים המוכשר עשה.
פורסם במקור בפורום CODE613 ב22/10/2015 17:20 (+03:00)
-
אני חושב שכל קובץ PDF . יש לו את המיפוי שלו.
כנראה נעשה בכוונה כדי להקשות על העתקה.פורסם במקור בפורום CODE613 ב22/10/2015 21:31 (+03:00)
8/10