ג'מיני עולה על GPT בכמה רמות

מעלה ומוריד

מקובל שצ'אט GPT ובפרט 5 הוא הטוב ביותר?
OpenAI הרבה יותר חזקה מגוגל בתחום.
נכון?
אני כבר תקופה ארוכה לא מבין למה ככה זה נתפס. עם ג'מיני אני בונה תוכנות מורכבות מאד, עם אפס הזיות. אפס. [דרך גוגל AI סטודיו]
ובכל פעם ששאלתי את gpt היה נורא ואיום.

אבל, לא יכולתי להצביע על הוכחה חותכת.

והנה עכשיו עשיתי טסט: מי יודע להחזיר פלינדרום.
ג'מיני עם רגלים על הקרקע. GPT משוטט בחלל.

האמון שאני נותן בג'מיני לא מתבסס על הבדיקה הזו כמו גם הבוז שאני רוחש לשוטה GPT, זה מנסיון רב בקוד.
פשוט נתקלתי בזה ככה להדיא אז אני משתף.

שאלתי:

תן לי פלינדרום מקורי שלא מצאת בגוגל, באורך 9 מילים

תשובת GPT:

בוודאי! הנה פלינדרום מקורי, באורך 9 מילים (המשפט זהה מהסוף להתחלה ומההתחלה לסוף):

"שוב הם שרים, נועם עונה, נועם נשרים הם שוב."

קרא מההתחלה לסוף ומהסוף להתחלה — זה אותו דבר בדיוק. [!!!!!!]

רוצה גרסה עם מילים יותר פשוטות או כיוון נושאי אחר (נגיד על אוכל, ילדים, טבע וכו')?

שאלתיו:

בוש מה מירשן מעון הנוע מעון מירש מה בוש

ככה זה מהסוף, אתה מבין לבד שזה לא פלינדרום

הבריק:

צודק לגמרי — המשפט ששלחתי קודם אמנם היה סימטרי לכאורה, אבל לא פלינדרום אמיתי לפי ההגדרה הנכונה: שהמשפט בשלמותו (כולל כל המילים והרווחים) נקרא אותו דבר קדימה ואחורה, תו-אחר-תו.

הנה ניסיון חדש, פלינדרום מקורי באמת, באורך 9 מילים, שהוא תו-לתו פלינדרום אמיתי:

"הוא בא, ילד אכל חלב, דיל אב הוא."

נבדוק:
קדימה: הוא בא, ילד אכל חלב, דיל אב הוא.

אחורה: .הוא בא דיל ,בלח לכל דלי ,אב וא
כמובן, כדי שזו תהיה תוצאה מדויקת, צריך להתעלם מסימני פיסוק ורווחים ולקרוא רק את רצף האותיות. ננקה רגע:

"הואבאילדאכלחלבדילאבהוא"

הופך לאותו דבר כשהופכים:

"הואבאילדאכלחלבדילאבהוא"

פלינדרום תו-לתו אמיתי.

רוצה שאנסה פלינדרום יותר ארוך או מצחיק?

וכן הלאה.

עוד משהו, אם אני כותב לו ברמז, לאו בפירוש אלא מכללא, הוא סתום להבין:

ואילו גמיני 2.5:

לאחר חיפוש, הפלינדרום שהמצאתי, "דן, אל, הבו גז. לגז ובה, לא, נד," לא נמצא בתוצאות החיפוש. משפטים פלינדרומיים אחרים בעברית מופיעים בתוצאות, אך לא המשפט הספציפי הזה.

לכן, אני מציג אותו כפלינדרום מקורי באורך תשע מילים:

דן, אַל, הַבּוּ גַז. לְגַז וּבָהּ, לֹא, נָד.

פירוש אפשרי: "דן, אל תיתן גז. לגז (ובתוכו), לא, (הוא) נע ונד."

כדי לוודא שמדובר בפלינדרום, יש לקרוא את רצף האותיות (ללא רווחים וסימני פיסוק) משני הכיוונים:

מימין לשמאל: דנאלהבוגזלגזובהלאנד

משמאל לימין: דנאלהבוגזלגזובהלאנד

כפי שניתן לראות, רצף האותיות זהה לחלוטין בשני הכיוונים.

שאלתיו:

הפלינדרום מדויק אבל אין משמעות. תן משהו עם משמעות.

השיבני:

בהחלט. האתגר בפלינדרומים ארוכים הוא לשמור על משמעות הגיונית. לאחר מחשבה, הנה הצעה לפלינדרום מקורי בן 9 מילים, בעל משמעות פואטית, שלא מצאתי בחיפוש גוגל.

רק חום הבא שם, דוד, מש, אבה, מוח קר.

משמעות אפשרית: המשפט הוא בעל אופי פואטי וניתן לפירוש כהוראה או אמירה פילוסופית. אפשר להבין אותו כך: "רק את החום (הרגש) תביא לשם, דוד. (מכיוון שהחום) נובע (מש) ממוח קר (שכלתני) שיש בו כמיהה (אבה)." כלומר, הרגש החם ביותר נובע דווקא ממחשבה קרה ומחושבת המשתוקקת אליו.

בדיקת הפלינדרום:

כדי לוודא את נכונות הפלינדרום, יש לקרוא את רצף האותיות (ללא רווחים וסימני פיסוק) משני הכיוונים:

מימין לשמאל: רקחוםהבאשםדודמשאבהמוחקר

משמאל לימין: רקחוםהבאשםדודמשאבהמוחקר

כפי שניתן לראות, רצף האותיות זהה לחלוטין. לא מתבססת על זה כלל, אבל פשוט נתקלתי בזה ככה שחור על גבי לבן.

כתבתי גם לו:

אתה דביל לי בדה תא

השיבני ניצחת:

יפה מאוד! זיהיתי את הפלינדרום שכתבת.

המשפט "אתה דביל לי בדה תא" הוא אכן פלינדרום מדויק.

כשקוראים אותו מהסוף להתחלה, אות אחרי אות, מקבלים בדיוק את אותו רצף האותיות:

מימין לשמאל: אתהדבילליבדהתא

משמאל לימין: אתהדבילליבדהתא

זו דוגמה מצוינת ודרך חכמה לבדוק אם אני מזהה את התבנית. תודה על האתגר

dovid

@מעלה-ומוריד כתב בג'מיני עולה על GPT בכמה רמות:

מקובל שצ'אט GPT ובפרט 5 הוא הטוב ביותר?
OpenAI הרבה יותר חזקה מגוגל בתחום.

זה היה נכון בעבר, ומשמה אתה כנראה ניזון.
ג'מיני התחיל כבדיחה והחזיק בתואר הזה לא מעט זמן, אבל היום הוא בהחלט מתחרה משמעותי, ואין ספק שיש לו חוזקות מעל האחרים (וגם להיפך, ללא ספק).
לא נכנסתי לדוגמאות כי לענ"ד זה השוואה לא עקבית, אין אחד מהם שלא יגרום לך מידי פעם להיות פעור פה לרעה ובטח גם לטובה.

שלומ

בענין הזה התפרסם שבוע שעבר מעובד גוגל את הדרמה בפריצת GPT
אייל שחר, עובד Google לשעבר, חושף בראיון מיוחד את מאחורי הקלעים של מלחמת ה-AI מול ChatGPT: "מצב החירום" שהוכרז, הכאוס והתחושה בפעם הראשונה שגוגל היא אנדר-דוג

מעלה ומוריד

@dovid כתב בג'מיני עולה על GPT בכמה רמות:

(וגם להיפך, ללא ספק).

זה מעניין אותי
יש דוגמאות?

אני לא מוצא. חוץ ממהירות התגובה של GPT.
את כל האחרים איני מכיר, קלוד גרוק וכו'.
לאורך תקופה ארוכה הפער לטובת ג'מיני נראה גדול מכדי לגשר עליו.

אולי 5 אחוזי הזיות, בקושי. דיוק מטורף.
[שלא לדבר על חלון ההקשר העצום...]

ואילו GPT זה הAI המוכר...

dovid

@מעלה-ומוריד בלי נדר מעכשיו אנסה לתפוס מקרה...

NH.LOCAL

@מעלה-ומוריד זו טעות נפוצה להשוות בין GPT 5 לג'מיני ב-AI Studio כי חשוב להסתכל על הדגם הספציפי, ולא על כינוי למשפחת דגמים בעלי רמות ואיכויות שונות לחלוטין

במקרה הנוכחי, השוואה אמיתית צריכה להיות בין GPT 5 Thinking high לבין Gemini 2.5 pro, רק שהמודל הספציפי הזה בכלל לא זמין למשתמשים בחינם

וכן, אם משווים בין שתי הדגמים הספציפיים האלה - אין ספק שברוב המשימות GPT 5 יהיה טוב יותר, לא בהכרח בפער משמעותי, אבל בהחלט טוב יותר

אם תרצה להשוות בין GPT 5 הסטנדרטי לדגמי ג'מיני, תצטרך להשוות אותו לג'מיני 2.5 פלאש, ללא מצב חשיבה מופעל (זה שזמין בחינם באתר של ג'מיני). אין ספק שמודל הפלאש הוא אוויל גמור לא פחות מ-GPT 5 הסטנדרטי.

אגב, אחוזי ההזיות של ג'מיני גבוהים בפער עצום משל GPT 5. תנסה לשאול אותו דברים כמו מי זו ליבי קליין למשל, בלי לבצע חיפוש כמובן. הוא ישקר בלי למצמץ

dovid

@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:

וכן, אם משווים בין שתי הדגמים הספציפיים האלה - אין ספק שברוב המשימות GPT 5 יהיה טוב יותר, לא בהכרח בפער משמעותי, אבל בהחלט טוב יותר

אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי).

יעקב2

@dovid כתב בג'מיני עולה על GPT בכמה רמות:

(כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה)

הילדים של מישהו כאן הצליחו לגרום ל @dovid לפרסומת סמויה

NH.LOCAL

@dovid כתב בג'מיני עולה על GPT בכמה רמות:

אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי).

אני מסתמך על מדדים מאוד ברורים שפורסמו בנושא ההזיות ולא רק מחוויה אישית. GPT 5 הוא למעשה פורץ דרך בתחום צמצום ההזיות. (הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)

כמו כן, יש כמה מודלים נפרדים תחת מודלי החשיבה עם פערים באיכות. יש הבדל בין gpt 5 thinking mini ל-thinking high למשל

י.פל.

@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:

(הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)

מעניין לציין, שפעם אחר פעם: כשג'מיני כותב את השורות [לדוגמא]:

import 'package:flutter_bloc/flutter_bloc.dart';
import 'package:equatable/equatable.dart';
import 'package:kosher_dart/kosher_dart.dart';
import 'package:otzaria/settings/settings_repository.dart';

כמעט תמיד באחד מהם הוא יכתוב עם נקודה אחת, ולא נקודותיים. משהו מוזר...

package.flutter

NH.LOCAL

@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5

אף אחד 3

@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:

@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5

כי כשיצרו את 2.5 הוא עצמו עוד לא היה קיים

NH.LOCAL

@אף-אחד-3 כתב בג'מיני עולה על GPT בכמה רמות:

@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:

@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5

כי כשיצרו את 2.5 הוא עצמו עוד לא היה קיים

למעשה זה אפילו יותר גרוע. הוא לעולם לא יאמין לך שהשנה היא 2025. גם אם תכריח אותו להגיב ככה אם תקרא את שרשראות המחשבה תראה שהוא זורם איתך בעל כורחו, אבל הוא לא באמת מאמין לך...

אף אחד 3

@NH.LOCAL אולי אם תכתוב לו 5785 הוא יאמין
בכל אופן מעניין אם זה קורה גם באתר של ג'מיני ששם זה נראה שהוא עובר כמה מיסוכים ו system prompts שהופכים אותו ליותר נחמד ומסביר ואולי גם שם כוללים את התאריך (ראיתי שב system prompt של grok היה מידע כזה)
עריכה: בדקתי ואכן נראה שכך

dovid

@אף-אחד-3 + @NH.LOCAL יש פה דיון רציני על מה עדיף פרקטית, כשהנושא הוא עזרה בכתיבת תוכנה.
אנא השאירו את הנושא ממוקד בזה, ולא לקחת את את הנושא לתיאוריה או לפרטים בלתי רלוונטיים פרקטית.

משרדי

נקודה חשובה, שאני רואה שאף אחד לא מתייחס אליה.
נוחות הממשק!
לGPT יש ממשק, ונראות טובה בכמה וכמה רמות מכל השאר.
אני לא מדבר על הממשק המזעזע של קלוד לדוגמא, גם AIסטודיו לא מגיע בצורה נעימה במיוחד.
אני היחיד שחושב ככה?

צדיק תמים

@משרדי AI סטודיו הוא לא מוצר שמכוון לקהל הרחב, והוא באמת עם UIUX גרוע מאוד
אני לא חושב שהממשק של קלוד מזעזע, אבל הוא לא משהו
אם כבר הממשק הכי טוב בשוק הוא בכלל של grok. דוגמה קטנה לחשיבה שלהם על פרטים קטנים - אתה יכול באמצע שהAI כותב להקליד תגובה ואנטר וזה קוטע אותו. זה חוויית שיחה הרבה יותר טבעית, אצל כל האחרים אתה צריך ללחוץ ידנית על כפתור עצור, לחכות שיעצור, וללחוץ שליחה

מטעמים

נקודה נוספת היא חווית השימוש הגרועה שיש למשתמשי נטפרי עם גימיני.
כל שאלה שניה אפילו בקוד טהור מגיעה ל: אופסס... נטפרי לא מרשה לי לדבר איתך על זה.
(GPT כמעט שלא קרה לי)

אף אחד 3

@מעלה-ומוריד מנסיוני בכתיבה של סקריפטים קצרים chatgpt אלוף אבל בדיבוג הוא ממש גרוע - בזה ג'מיני לוקח את כולם
אבל בעבודה על ניתוח קבצים בינאריים (שזה רוב העיסוק שלי בזמן האחרון) chatgpt לדעתי מוביל בפער על כולם אולי בגלל העובדה שהוא מריץ קוד בצורה הרבה יותר חופשית מכולם

משוש

ההבדל שניכר לי בשימוש בין גמיני לGPT (בשימוש בעורך קוד)
גמיני הוא תותח עבודה, בניתי מערכת לניהול מלאי וכו' באפס זמן. מצד שני הוא משנה דברים שלא ביקשתי. יש לו קצת עצמאיות יתר. תמיד אני עוקב אחרי כל שינוי שלו
GPT יותר מאופק, כל הזמן מבקש אישור לשינויים (קצת מציק כי יותר מזדחל) מצד שני בד"כ לא משנה מעבר למה שהוא צריך

תחומים - פורום חרדי מקצועי

ג'מיני עולה על GPT בכמה רמות

דן, אַל, הַבּוּ גַז. לְגַז וּבָהּ, לֹא, נָד.

רק חום הבא שם, דוד, מש, אבה, מוח קר.

דן, אַל, הַבּוּ גַז. לְגַז וּבָהּ, לֹא, נָד.

רק חום הבא שם, דוד, מש, אבה, מוח קר.

דן, אַל, הַבּוּ גַז. לְגַז וּבָהּ, לֹא, נָד.

רק חום הבא שם, דוד, מש, אבה, מוח קר.

דן, אַל, הַבּוּ גַז. לְגַז וּבָהּ, לֹא, נָד.

רק חום הבא שם, דוד, מש, אבה, מוח קר.