<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[באיזה תוכנת אינדקס גוגל משתמשים?]]></title><description><![CDATA[<p dir="auto">שלום רב לאור ההתעוררות הגדולה לאחרונה בציבור<br />
לתוכנות של חיפוש מהיר באמצעות אינדקס,</p>
<p dir="auto">ברצוני לברר האם מישהוא מכיר את התוכנה שגוגל משתמשים בה לאנדקס,<br />
אולי נוכל להישג אותה לטובת הציבור כאן?</p>
<p dir="auto">פרטים נוספים על התוכנה של גוגל <a href="https://www.google.com/intl/iw/search/howsearchworks/how-search-works/organizing-information/" target="_blank" rel="noopener noreferrer nofollow ugc">תוכנת 'סורקים'.</a></p>
]]></description><link>https://tchumim.com/topic/16514/באיזה-תוכנת-אינדקס-גוגל-משתמשים</link><generator>RSS for Node</generator><lastBuildDate>Fri, 10 Apr 2026 16:59:41 GMT</lastBuildDate><atom:link href="https://tchumim.com/topic/16514.rss" rel="self" type="application/rss+xml"/><pubDate>Fri, 02 Aug 2024 07:06:04 GMT</pubDate><ttl>60</ttl><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 13:52:12 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/5566brs">@<bdi>5566brs</bdi></a> כתב ב<a href="/post/163511">באיזה תוכנת אינדקס גוגל משתמשים?</a>:</p>
<blockquote>
<p dir="auto">bigtable</p>
<p dir="auto"><a href="https://stackoverflow.com/questions/362956" target="_blank" rel="noopener noreferrer nofollow ugc">https://stackoverflow.com/questions/362956</a> (מקור)</p>
</blockquote>
<p dir="auto">זה רק שכבת האחסון, רכיב אחד של תוכנה מורכבת</p>
<p dir="auto">נ.ב. לכאורה הבנת את דברי השואל שהוא מדבר על אינדקס "רגיל". מדובר פה על אינדקס שמיועד ל-full text search (חיפוש בתוכן העמודות, דבר שלא נתמך על ידי אינדקס של btree)<br />
זה עדיין נכון שהרבה מנועי מסד נתונים תומכים בזה ברמה כזו או אחרת</p>
]]></description><link>https://tchumim.com/post/163519</link><guid isPermaLink="true">https://tchumim.com/post/163519</guid><dc:creator><![CDATA[yossiz]]></dc:creator><pubDate>Fri, 02 Aug 2024 13:52:12 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 13:36:02 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%D7%90%D7%9C%D7%A3-%D7%A9%D7%99%D7%9F">@<bdi>אלף-שין</bdi></a><br />
אני מעריך את הרצון שלך להעמיק ולחקור את התחום, אך ברצוני להציע לך לשקול לא להשקיע את זמנך בדברים הללו. חקירה שטחית של נושא מורכב כמו אינדוקס ללא הבנה מעמיקה יותר עלולה לגזול זמן רב ויקר ממך ולא להביא לתוצאות הרצויות.<br />
בהצלחה בדרכך!</p>
]]></description><link>https://tchumim.com/post/163518</link><guid isPermaLink="true">https://tchumim.com/post/163518</guid><dc:creator><![CDATA[pcinfogmach]]></dc:creator><pubDate>Fri, 02 Aug 2024 13:36:02 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Sat, 10 Aug 2024 21:23:50 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/yossiz">@<bdi>yossiz</bdi></a> כתב ב<a href="/post/163515">באיזה תוכנת אינדקס גוגל משתמשים?</a>:</p>
<blockquote>
<p dir="auto">עיין כתבה זו על האתגרים המיוחדים בעברית</p>
</blockquote>
<p dir="auto">הכתבה הנ"ל לבסוף הובילה לפרוייקט יפה מאוד שקורים לו HEBMORPH.<br />
ברצוני לכתוב כמה השגות שהיו לי על פרוייקט זה - בעצם כמנוע חיפוש כללי הוא באמת משדרג את החיפוש בהמון. חשוב לציין שהמילון שהוא משתמש בו נמצא בשימוש על ידי מנוע החיפוש של גוגל ועוד כמה מנועי חיפוש מפורסמים והעקרונות שלו ה עקרונות חזקים ומנוסים.</p>
<p dir="auto">יחד עם זאת כשמדברים על  HEBMORPH ודומיו, חשוב להבין שמדובר בפרויקט שמנסה לבנות חיפוש חכם בעברית. אבל האם חיפוש חכם מתאים תמיד לצרכי המשתמש? אני לא בטוח. ניקח לדוגמה את הסרת ה-stopwords (מילים כמו "כי"). בחיפוש כללי, זה מייעל את האינדוקס והחיפוש, אבל בחיפוש תורני, לעיתים עדיף לחפש את המשפט כולל "כי", במיוחד בחיפוש פסוקים. בנוסף, הפרויקט HEBMORPH מבוסס על מילון עברי כללי, מה שמפחית את ביצועיו בחיפוש תורני.</p>
<p dir="auto"><strong>עריכה:</strong> כל זה נכון אם יש לך אמפמינציה אישית של lucene אבל אם אתה משתמש בו כמות שהוא אתה רק מרוויח אם אתה משתמש ב-HEBMORPH למה? כי Lecene הינו מנוע חיפוש ולשכך הוא בנוי על אלגוריתמים שמחשבים רלוונטיות וממילא כל כלי שמתעל את הרלוונטיות מתעל את המנוע.</p>
<p dir="auto">הנקודה היא שקשה לייצר מנוע חיפוש כוללני כי הצרכים משתנים ממקרה למקרה.</p>
<p dir="auto">אישית בתוכנות שלי ב-C# אני לא משתמש ב- HEBMORPH מחמת סיבה צדדית, כי הוא לא מעודכן לגרסה האחרונה של Lucene, מה שמקשה מאוד על השימוש בו. אציין גם שיש חלקים בקוד שהם ממש לא אינטואיטיביים, כך שהתייאשתי לבינתיים מלנסות להתאים את HEBMORPH לגרסה הנוכחית. זה יצריך ממני ללמוד לעומק את הגרסה הישנה ואז לתרגם אותה לחדשה, ואין לי את הזמן או את העצבים לזה.</p>
]]></description><link>https://tchumim.com/post/163517</link><guid isPermaLink="true">https://tchumim.com/post/163517</guid><dc:creator><![CDATA[pcinfogmach]]></dc:creator><pubDate>Sat, 10 Aug 2024 21:23:50 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 12:35:22 GMT]]></title><description><![CDATA[<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/5566brs">@<bdi>5566brs</bdi></a> כתב ב<a href="/post/163511">באיזה תוכנת אינדקס גוגל משתמשים?</a>:</p>
<blockquote>
<p dir="auto">בכל תוכנות מסדי הנתונים הנפוצות (שאני מכיר) יש אפשרות לאינדקסים</p>
</blockquote>
<p dir="auto">יש לציין שכדי לקבל אינדקס טוב צריך תמיכה ייעודית עבור השפה, בלי זה החיפוש לא יעבוד טוב אם הטקסט לחיפוש לא קיים במדוייק, תמיכה בעברית פחות נפוץ. זה רלוונטי גם לגבי פוסט שלי על פרוייקטים מפורסמים בקוד פתוח<br />
עיין <a href="https://code972.com/blog/2010/05/challenges-with-indexing-hebrew-texts-hebmorph-part-1-18" target="_blank" rel="noopener noreferrer nofollow ugc">כתבה זו</a> על האתגרים המיוחדים בעברית</p>
<p dir="auto"><a class="plugin-mentions-user plugin-mentions-a" href="/user/%D7%90%D7%91%D7%99">@<bdi>אבי</bdi></a> כתב ב<a href="/post/163512">באיזה תוכנת אינדקס גוגל משתמשים?</a>:</p>
<blockquote>
<p dir="auto">אם אתה מחפש תוכנה לחיפוש קבצים מקומיים<br />
מומלץ ביותר <a href="https://www.voidtools.com/" target="_blank" rel="noopener noreferrer nofollow ugc">https://www.voidtools.com/</a></p>
</blockquote>
<p dir="auto">מדובר פה על חיפוש בתוכן הקבצים, לא רק חיפוש קובץ לפי שם הקובץ</p>
]]></description><link>https://tchumim.com/post/163515</link><guid isPermaLink="true">https://tchumim.com/post/163515</guid><dc:creator><![CDATA[yossiz]]></dc:creator><pubDate>Fri, 02 Aug 2024 12:35:22 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 09:10:12 GMT]]></title><description><![CDATA[<p dir="auto">אם אתה מחפש תוכנה לחיפוש קבצים מקומיים<br />
מומלץ ביותר <a href="https://www.voidtools.com/" target="_blank" rel="noopener noreferrer nofollow ugc">https://www.voidtools.com/</a></p>
]]></description><link>https://tchumim.com/post/163512</link><guid isPermaLink="true">https://tchumim.com/post/163512</guid><dc:creator><![CDATA[אבי]]></dc:creator><pubDate>Fri, 02 Aug 2024 09:10:12 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 08:50:20 GMT]]></title><description><![CDATA[<p dir="auto"><a href="https://research.google/pubs/bigtable-a-distributed-storage-system-for-structured-data/" target="_blank" rel="noopener noreferrer nofollow ugc">bigtable</a></p>
<p dir="auto"><a href="https://stackoverflow.com/questions/362956" target="_blank" rel="noopener noreferrer nofollow ugc">https://stackoverflow.com/questions/362956</a> (מקור)</p>
<p dir="auto">אגב:</p>
<ol>
<li>
<p dir="auto">המינוח "תוכנת סורקים" מקורו בטעות של התרגום האוטומטי.<br />
תרגום יותר נכון יהיה "תוכנות סריקה", כשהכוונה היא לcrawlers כמושג כללי, ולא אל תוכנה ספציפית.<br />
אפשר לעיין <a href="https://www.google.com/intl/en/search/howsearchworks/how-search-works/organizing-information/" target="_blank" rel="noopener noreferrer nofollow ugc">בדף המקורי ללא תרגום לעברית</a> כדי לראות את הטעות.</p>
</li>
<li>
<p dir="auto">בכל תוכנות מסדי הנתונים הנפוצות (שאני מכיר) יש אפשרות לאינדקסים.</p>
</li>
</ol>
]]></description><link>https://tchumim.com/post/163511</link><guid isPermaLink="true">https://tchumim.com/post/163511</guid><dc:creator><![CDATA[5566brs]]></dc:creator><pubDate>Fri, 02 Aug 2024 08:50:20 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 08:11:31 GMT]]></title><description><![CDATA[<p dir="auto">להוסיף על מה ש@A-I-V כתב:<br />
גם אם ישחררו את הקוד זה לא יהיה רלוונטי כמעט לאינדוקס וחיפוש בקבצים לוקליים. לחיפוש ווב יש צרכים ייחודיים משלו.<br />
בכל מקרה יש כמה פרוייקטים מפורסמים בקוד פתוח ולא צריך דוקא את הקוד של גוגל</p>
]]></description><link>https://tchumim.com/post/163510</link><guid isPermaLink="true">https://tchumim.com/post/163510</guid><dc:creator><![CDATA[yossiz]]></dc:creator><pubDate>Fri, 02 Aug 2024 08:11:31 GMT</pubDate></item><item><title><![CDATA[Reply to באיזה תוכנת אינדקס גוגל משתמשים? on Fri, 02 Aug 2024 07:28:17 GMT]]></title><description><![CDATA[<p dir="auto">תוכנה פנימית שלהם,<br />
שהם לא ישחררו לעולם..<br />
זה בעצם הסוד שלהם</p>
]]></description><link>https://tchumim.com/post/163507</link><guid isPermaLink="true">https://tchumim.com/post/163507</guid><dc:creator><![CDATA[A.I.V]]></dc:creator><pubDate>Fri, 02 Aug 2024 07:28:17 GMT</pubDate></item></channel></rss>