ספריית החיפוש meilisearch ב-בC#
-
חבל להמציא את הגלגל כשעשו לך כבר את העבודה, בפרט טיפול מיוחד בעברית כולל הבנת שורשים מתקדמת עם מילון וגם אלגוריתמים, שזו עבודת נמלים לבנות לבד.
meilisearch כולל באופן מובנה תמיכה ברלוונטיות, כלומר האינדקס כבר לוקח בחשבון מרחק וסדר של מילים, מרחק לוינשטיין לשגיאות כתיב, משקל שונה לכל שדה, והכל עם כפית של כסף out-of-the-box.
גם המהירות היא משמעותית, ועדיף להשתמש במנוע שכתוב בשפה מהירה כמו C++ או RUST.
לאנדקס לבד יכול להתאים למשימות קטנות יותר, אבל כשמדובר על כמה עשרות מיליונים של טקסטים, צריך בולדוזר מוכח.@sivan22 כתב בספריית החיפוש meilisearch ב-בC#:
חבל להמציא את הגלגל כשעשו לך כבר את העבודה
@sivan22 כתב בספריית החיפוש meilisearch ב-בC#:
אני כרגע מנסה אותה בשביל פרוייקט שלי, החיסרון המשמעותי הוא הגודל העצום של האינדקס, היא מיועדת בעיקר לשרתים ולא למשתמשי קצה ולכן אין אופטימיזציה של הגודל
-
@אלף-שין,
כמישהו שחקר את הנושא למעלה משנה, אני רוצה לשתף אותך בתובנות שלי. התיאוריה של בניית אינדקסים באמת נשמעת פשוטה וקליטה, אבל היישום הרבה יותר מורכב. דוגמה קטנה לכך:כשאינדקס שוקל כמה גיגה-בייטים, כמה זמן לדעתך לוקח לקרוא את התוכן שלו בצורה הקלאסית של קריאת תוכן קובץ? הבעיה היא שאי אפשר לטעון אינדקס כזה לזיכרון ה-RAM כי הוא גדול מדי. לכן, נאלצים לעבור שורה שורה באינדקס בזמן החיפוש.
אני מקצר כי אין לי כוח להאריך, אבל תאמין לי, בניית אינדקס זה לא דבר של מה בכך. במיוחד כשמדובר באינדקסים גדולים.
@pcinfogmach כתב בספריית החיפוש meilisearch ב-בC#:
כשאינדקס שוקל כמה גיגה-בייטים, כמה זמן לדעתך לוקח לקרוא את התוכן שלו בצורה הקלאסית של קריאת תוכן קובץ?
זהותון מחפש תוך פחות משנייה על 3.5 GB שזה הרי ללא אינדקס........ [כי בכל אופן זה מילים חדשות אז אין מה לאנדקס....]
-
@sivan22 כתב בספריית החיפוש meilisearch ב-בC#:
חבל להמציא את הגלגל כשעשו לך כבר את העבודה
@sivan22 כתב בספריית החיפוש meilisearch ב-בC#:
אני כרגע מנסה אותה בשביל פרוייקט שלי, החיסרון המשמעותי הוא הגודל העצום של האינדקס, היא מיועדת בעיקר לשרתים ולא למשתמשי קצה ולכן אין אופטימיזציה של הגודל
@אלף-שין
כשזהו החיסרון היחיד זה מתגמד לעומת כל שאר התועליות -
@אלף-שין
כשזהו החיסרון היחיד זה מתגמד לעומת כל שאר התועליות@pcinfogmach
לפעמים זה נכון,
קח לדוגמה את המאגר של היברו בוקס,
מדובר על מאות גיגה! [קרוב ל650]
אם ניצור אינדקס באמצעות הספריה הזאת,
כמה זה ישקול?......
קרוב ל2 TB!