חילוץ טקסט מהערות שוליים בקובץ RTF
-
כדי לחלץ את הטקסט מקובץ RTF יש את הפונקציה הבאה:
Private Shared Function ConvertToText(rtf As String) As String Using rtb As New RichTextBox() rtb.Rtf = rtf Return rtb.Text End Using End Function
אבל הבעיה שאין זה מחלץ את ההערות שוליים מקובץ ה RTF כיון שפקד RichTextBox לא קורא אותם מלכתחילה.
איך א''כ אני יכול לחלץ את טקסט ההערות ?שבת שלום ובתודה לכולם.
פורסם במקור בפורום CODE613 ב06/12/2013 12:55 (+02:00)
-
ממש לא דומה לוורד, כיון שמסמך DOCX הוא למעשה ZIP של קבצי XML וקובץ DOC הוא בינארי לגמרי, וקובץ RTF עם הערות הוא ממש כמו RTF רגיל, כלומר נפתח בפנקס רשימות בקידוד ברירת מחדל של וינדוס ויש בו את כל התגים הרגילים של RTF עם תוספת של עוד המון תגים שוורד הוסיף.
מה שצריך לעשות זה לדעת איך לסנן את כל התגים ומילות השליטה ולסנן את הטקסט בלבד, יש כאן פרוייקט שחשבתי שיעזור לי אבל גם הוא לא קורא את ההערות משום מה.פורסם במקור בפורום CODE613 ב08/12/2013 17:20 (+02:00)
-
יש לי תוכנת חיפוש תוכל להורידה מכאן, היא מחפשת בין השאר גם בקבצי RTF אלא שאם יש בקבצים אלו הערות שוליים שנעשו בוורד, התוכנה לא מזהה אותם וכמו שהפקד של טקסט עשיר לא מזהה אותם, ואני רוצה שהתוכנה תחפש גם בהערות שוליים שבקבצי RTF.
אודה על עזרתכם!
פורסם במקור בפורום CODE613 ב08/12/2013 19:52 (+02:00)
-
קודם כל, התוכנה מאוד יפה
מה שכן כעת מתברר לי מדוע בתוכנת 'תג' (מי שיודע במה מדובר) יש לייבא בנפרד קובץ הערות שוליים
אבל זכור לי שגם שם לאחרונה יש גירסה שכן יכולה לייבא עם הערות שוליים אמנם אני לא רגיל להשתמש בזהפורסם במקור בפורום CODE613 ב08/12/2013 21:08 (+02:00)