אתה מחפש למשל "ויאמר אלי העבד אולי"
אתה בונה רשימה של מיקומים שנמצאו של המילה הראשונה, ככה:
מסמך, מיקום, מילה
כעת אתה מחפש את המילה השניה, ומוסיך לרשימת המיקומים.
וכן הלאה.
בסוף אתה מקבץ את הרשימה לפי מסמך, וממיין את תת הרשימה לפי מיקום.
אתה עובר על הרשימה, וכל פעם בודק מרחק מהמילה הקודמת.
למשל:
בראשית 950 ויאמר
בראשית 1100 אלי
בראשית 1200 ויאמר
בראשית 1300 העבד
בראשית 1320 ויאמר
בראשית 1321 אלי
בראשית 1322 העבד
בראשית 1323 אלי
אתה עובר בלולאה על המופעים, לכל אחד מהמופעים תצמיד שני מאפיינים: ציון מספרי שיהיה 25 (למשל, כמאה לחלק למספר מילות החיפוש), ומאפיין סט שיכיל את המילים הנוספות שיכולות להיחשב כסט עם התוצאה הנוכחית.
בכל אחד, נניח בראשון, אתה בודק את המרחק בינו לזה שלאחריו, אם הוא קטן ממרחק עליו החלטת כמקסימלי למשל 20, והמילה הבאה אחריו לא מופיעה כבר בסט, אתה מוסיף לציון שלו את ציון האות שאחריו, ומוסיף את האות לסט שלו.
כעת אתה עובר למילה הבאה, ובודק אותו דבר עד שאתה חורג מהמרחק 20, שאז אתה מתחיל את התהליך שוב עם התוצאה מס' 2.
בסוף אתה יכול לחלק ציון גבוה יותר בכל תוצאה שבה צמדי מילים בסט הם בסדר המקורי של מילות השאילתה ולא להיפך, ועוד ציון לכאלה שהצמד בא רצוף.
בסופו של תהליך אתה משמיט מי שהציון שלו נמוך מ75 או 50.