REGEX בשביל מרחק בין מילים כמו פרוייקט השו"ת
-
תגובה: תוסף חיפוש רגקס בוורד
@pcinfogmach כתב בתוסף חיפוש רגקס בוורד:
למרות שזוהי שאלה כללית אני שם אותה פה כי אנשים שאלו אותי את זה בקשר לתוסף:
יש למישהו רעיון למחרוזת טובה של רגקס שאפשר להשתמש איתה לדמות בחירת מרווח בין מילים כמו שיש בחיפוש בר אילן (כלומר מקסימום כמות מילים בין מילות החיפוש)?
בחיפוש המובנה של וורד הניסיונות שלי עלו בתוהו (גם לעשות על ידי מרווח בין אותיות לא מצליח).נ.ב. לכאורה עדיף שיהיה טוב גם עבור מקרה שהמילה מכילה ראשי תיבות.
עריכה: אולי משהו כזה:
tchumim(\W*\w*){1,5}comhttps://regex101.com/r/eeOTX0/4
אשמח לקבל משוב.אם זה רג'קס מבוסס דוטנט אני חושב שאתה יכול לעשות ככה:
tchumim\b[ ,.]*(\w+\b[ ,.]*){0,5}\bcomhttps://regex101.com/r/zPDUqt/1
עריכה, מרובה שורות:
https://regex101.com/r/vpkgkT/1 -
זה כמובן צריך שיפוצים, אני זוכר שיש ראשי תיבות, סוגריים וכולי.
בכל מקרה זה לא נח לבן אדם מהשורה לכתוב כאלה ביטויים, בשביל זה העיניים נשואות אליך שתכתוב כלי שהממשק שלו 1:1 כמו פרוייקט השו"ת למען ירוץ בו המחפש.@dovid
ככה טוב?\bword\b\W+(?:\w+\W+){0,5}\bword\b -
@pcinfogmach נראה טוב, אבל זה כעת לוכד גם word"word כלומר ראשי תיבות נחשבים שני מילים הן לעניין האיתור שלהם והן לעניין ספירת המרחק.
@dovid
תודה הוספתי תיקון לראשי תיבות על ידי הגדרת טווח\bword\b\W+(?:[\w""]+\W+){0,5}\bword\bכרגיל טווח כזה יכול לייצר בעיות כי הוא יכלול גם מילה שמסתיימת עם מירכאות (כלומר סוף משפט שבתוך מירכאות)
ברם במקרה הזה לכאורה אין בעיה כי המטרה היא מרחק בין מילים