LINQ To XML: מונה של התווים בקובץ
-
יש לי קבצי XML שמכילים OCR של תמונות של ספרים, ואני רוצה לנתח אותם כדי לבנות אינדקס לחיפוש בתוכם.
כמו שדוד המליץ אני רוצה לבנות אינדקס של כל המילים ע"פ המיקום שלהם בקובץ (מבחינת התווים). לשם כך אני צריך לדעת מה המיקום של כל ענף בXML (דהיינו מה מספר התו הפותח שלו ומה הסוגר), כדי שאוכל לגשת אליו לאחר מכן ולשלוף את כל המידע שיש לי בו.
האם ישנה פונקציה מובנית בLINQ שיכולה להחזיר לי את מס' התו בקובץ, או שאני צריך לעשות זאת לבד, ולנתח את הקובץ ללא שימוש בLINQ?
תודה רבה מראש!פורסם במקור בפורום CODE613 ב18/08/2016 11:23 (+03:00)
-
Length
http://www.java2s.com/Tutorial/CSharp/0450__LINQ/QuerybystringlengthwithLinq.htm
פורסם במקור בפורום CODE613 ב18/08/2016 11:36 (+03:00)
-
Length
למיטב הבנתי זה מחזיר את האורך של המילה, אך אני רוצה את המיקום של התו של המילה, כלומר התו ה34500 מתחילת הקובץ.
את זה זה לא נותן לי, ואני גם לא יכול לחשב את כל הlength של כל התווים בקובץ כיון שאני צריך לדעת גם את הרווחים..פורסם במקור בפורום CODE613 ב18/08/2016 11:59 (+03:00)
-
בLinq2xml א"א, אבל אפשר ע"י מפרשי XML אחרים (למשל XmlReader עם המתודה הזאת למשל http://stackoverflow.com/a/19899849/1271037).
אני מסתייג מדרכך, אני הייתי בונה את הקובץ מחדש... הרי לטווח הרחוק בו מעניין אותי המיקום המדוייק שם לא מעניין אותי כל האינפורמציה מסביב.
כלומר הייתי מחלץ את הטקסט לקובץ אחר ושרושם את המיקומים בקובץ החדש.פורסם במקור בפורום CODE613 ב18/08/2016 17:08 (+03:00)