איך ליצור אינדוקס וחיפוש של מסמכי pdf ב-C#?
-
אני מנסה לבנות תוכנת חיפוש מותאמת לקבצי PDF, תוך שילוב אינדקס לפעולות חיפוש.
גדי לקבל את הטקסט אני משתמש עם הספרייה של itext ב- C#
יש לי שאלה לגבי מה הצורה הכי יעילה ליצירת האינדקס:
כדי לנהל את השימוש בזיכרון, בחרתי לנתח את המסמכים עמוד אחר עמוד. עם זאת, נתקלתי במגבלה משמעותית: כאשר התוכן משתרע על פני מספר עמודים, כגון משפטים או פסקאות, הוא בעצם נקטע באמצע על ידי החלוקה לעמודים.
אשמח לקבל עצה בענייןנ.ב. ייתכן מאוד שהשאלה לא מספיק ברורה אשמח לקבל מכם משוב מה צריך להבהיר יותר בשאלה כי הלוא "שאלת חכם חצי תשובה".
תודה מראש