מיקום בקובץ
-
@שרה-רחל אמר במיקום בקובץ:
היתה הנחיה כללית לשמור שני נתונים על המיקום של המילה
כקובץ טקסט הם בגודל אחיד?קבלתם אולי קובץ טקסט ספציפי שאיתו צריכים לעבוד ?
-
הנה הצטוט
הצגת כל המלים כאינדקס :לכל מלה הצגת המיקום שלה .לפחות שני סוגים שונים של הגדרת מיקום .למשל :שורות ועמודים ,וכן משפטים ופסקאות .אם בטקסט מוגדר מבנה - אחד המיקומים יהיה על פי המבנה .למשל ,אם יש פרקים- על נגדיר מיקום - , ידי משפט פסקה ופרק .אם מדובר בשירים עם בתים - נגדיר שורה בבית .או מדובר בקבצים של תכניות מחשב - לפי אפשר למפות ' מודולים ,מחלקות ,פונקציות וכו- . לפי המבנה -
אז אני מבין שלא ניתן טקסט ספציפי
@שרה-רחל אמר במיקום בקובץ:
לפחות שני סוגים שונים של הגדרת מיקום
נו אז מה הבעיה
תעשו שיר שמורכב כאילו מ2 טורים על ידי טאבים
ויהיה לכם 2 סוגים שונים- מעבר שורה
- טאב
או שתעשו טקסט שיכלול תוים כמו שהציע @yossiz
@yossiz אמר במיקום בקובץ:
יש תו Form Feed
ובא לציון גואל
-
@שרה-רחל כותב המשימה טעה לחלוטין בעניין הזה.
במסמכים נורמליים כמו טקסט פשוט ואפילו מסמך Word וכדומה, אין משמעות למספר שורה ולא לעמוד. המסמך הוא דינמי, אכן במסמך וורד יכולות להיות הגדרות פונט ועמוד,אבל הם לא מידע שייך למסמך ואין שום היגיון בעולם לאנדקס לפי עניין שולי ומשתנה שכזה.
אפילו במסמך קבוע כמו PDF אין משמעות לשורות בהמון מקרים, והם יופיעו או בהתאם לתצוגה או לפי המיקום המוחלט שלהם ביחס לשולי הדף.הם מדברים גם על מיפוי של בתים בשירים שזה עבודה אנושית שקשה מאוד לתת למחשב להבין, וגם על מיפוי תוכניות מחשב למחלקות ומודלים שזה מחייב לעשות Parser רציני למאות שפות תכנות, כשאפילו לאחת זה עבודה קשה שלא נותנים ככה כחלק מפרוייקט. בקיצור משהו פה קצת הזוי.
עריכה: מהציניות של @משחזר-מידע אני פתאום הבנתי שהם דרושים איזשהו שני מיקומים לא משנה מה, אז מספר מילה ומספר תו זה נראה לי מצויין וסביר יותר מכל הדוגמאות השגויות/היומרניות שהם הביאו.