@שרה-רחל כותב המשימה טעה לחלוטין בעניין הזה.
במסמכים נורמליים כמו טקסט פשוט ואפילו מסמך Word וכדומה, אין משמעות למספר שורה ולא לעמוד. המסמך הוא דינמי, אכן במסמך וורד יכולות להיות הגדרות פונט ועמוד,אבל הם לא מידע שייך למסמך ואין שום היגיון בעולם לאנדקס לפי עניין שולי ומשתנה שכזה.
אפילו במסמך קבוע כמו PDF אין משמעות לשורות בהמון מקרים, והם יופיעו או בהתאם לתצוגה או לפי המיקום המוחלט שלהם ביחס לשולי הדף.
הם מדברים גם על מיפוי של בתים בשירים שזה עבודה אנושית שקשה מאוד לתת למחשב להבין, וגם על מיפוי תוכניות מחשב למחלקות ומודלים שזה מחייב לעשות Parser רציני למאות שפות תכנות, כשאפילו לאחת זה עבודה קשה שלא נותנים ככה כחלק מפרוייקט. בקיצור משהו פה קצת הזוי.
עריכה: מהציניות של @משחזר-מידע אני פתאום הבנתי שהם דרושים איזשהו שני מיקומים לא משנה מה, אז מספר מילה ומספר תו זה נראה לי מצויין וסביר יותר מכל הדוגמאות השגויות/היומרניות שהם הביאו.