ג'מיני עולה על GPT בכמה רמות
-
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
וכן, אם משווים בין שתי הדגמים הספציפיים האלה - אין ספק שברוב המשימות GPT 5 יהיה טוב יותר, לא בהכרח בפער משמעותי, אבל בהחלט טוב יותר
אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי). -
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
וכן, אם משווים בין שתי הדגמים הספציפיים האלה - אין ספק שברוב המשימות GPT 5 יהיה טוב יותר, לא בהכרח בפער משמעותי, אבל בהחלט טוב יותר
אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי).@dovid כתב בג'מיני עולה על GPT בכמה רמות:
אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי).אני מסתמך על מדדים מאוד ברורים שפורסמו בנושא ההזיות ולא רק מחוויה אישית. GPT 5 הוא למעשה פורץ דרך בתחום צמצום ההזיות. (הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)
כמו כן, יש כמה מודלים נפרדים תחת מודלי החשיבה עם פערים באיכות. יש הבדל בין gpt 5 thinking mini ל-thinking high למשל
-
@dovid כתב בג'מיני עולה על GPT בכמה רמות:
אני חושש סתם לכתוב לך "לא מסכים בכלל" כי זה מאוד קשה להתווכח בתחום.
בא נתמקד בתכנות בלבד (כי בהחלט ייתכן שבתחומים של ליבי קליין החמצתי את התמונה ההפוכה) ותביא דוגמאות איכות.
אני נתקל בהרבה הזיות של ג'מיני בAI studio אבל בפירוש יש יותר בGPT-5 (אצלי הוא תמיד נכנס לחשיבה עמוקה, אולי בגלל סגנון הכתיבה שלי).אני מסתמך על מדדים מאוד ברורים שפורסמו בנושא ההזיות ולא רק מחוויה אישית. GPT 5 הוא למעשה פורץ דרך בתחום צמצום ההזיות. (הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)
כמו כן, יש כמה מודלים נפרדים תחת מודלי החשיבה עם פערים באיכות. יש הבדל בין gpt 5 thinking mini ל-thinking high למשל
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
(הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)
מעניין לציין, שפעם אחר פעם: כשג'מיני כותב את השורות [לדוגמא]:
import 'package:flutter_bloc/flutter_bloc.dart'; import 'package:equatable/equatable.dart'; import 'package:kosher_dart/kosher_dart.dart'; import 'package:otzaria/settings/settings_repository.dart';
כמעט תמיד באחד מהם הוא יכתוב עם נקודה אחת, ולא נקודותיים. משהו מוזר...
package.flutter
-
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
(הזיות לרוב הם ביחס לעובדות טריוויה ופחות ביחס לתכנות, כמעט אף מודל כיום לא ממציא חבילות PIP...)
מעניין לציין, שפעם אחר פעם: כשג'מיני כותב את השורות [לדוגמא]:
import 'package:flutter_bloc/flutter_bloc.dart'; import 'package:equatable/equatable.dart'; import 'package:kosher_dart/kosher_dart.dart'; import 'package:otzaria/settings/settings_repository.dart';
כמעט תמיד באחד מהם הוא יכתוב עם נקודה אחת, ולא נקודותיים. משהו מוזר...
package.flutter
-
@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5
-
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5
כי כשיצרו את 2.5 הוא עצמו עוד לא היה קיים
@אף-אחד-3 כתב בג'מיני עולה על GPT בכמה רמות:
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5
כי כשיצרו את 2.5 הוא עצמו עוד לא היה קיים
למעשה זה אפילו יותר גרוע. הוא לעולם לא יאמין לך שהשנה היא 2025. גם אם תכריח אותו להגיב ככה אם תקרא את שרשראות המחשבה תראה שהוא זורם איתך בעל כורחו, אבל הוא לא באמת מאמין לך...
-
@אף-אחד-3 כתב בג'מיני עולה על GPT בכמה רמות:
@NH.LOCAL כתב בג'מיני עולה על GPT בכמה רמות:
@י.פל. בזה עוד לא נתקלתי, אבל אם מדברים על ג'מיני, הבעיה הכי נוראית אצלו היא ההתעקשות שלו "לתקן" כל קוד שמזכיר את מודל gemini 2.5 למודל "העדכני ביותר" gemini 1.5
כי כשיצרו את 2.5 הוא עצמו עוד לא היה קיים
למעשה זה אפילו יותר גרוע. הוא לעולם לא יאמין לך שהשנה היא 2025. גם אם תכריח אותו להגיב ככה אם תקרא את שרשראות המחשבה תראה שהוא זורם איתך בעל כורחו, אבל הוא לא באמת מאמין לך...
@NH.LOCAL אולי אם תכתוב לו 5785 הוא יאמין
בכל אופן מעניין אם זה קורה גם באתר של ג'מיני ששם זה נראה שהוא עובר כמה מיסוכים ו system prompts שהופכים אותו ליותר נחמד ומסביר ואולי גם שם כוללים את התאריך (ראיתי שב system prompt של grok היה מידע כזה)
עריכה: בדקתי ואכן נראה שכך -
נקודה חשובה, שאני רואה שאף אחד לא מתייחס אליה.
נוחות הממשק!
לGPT יש ממשק, ונראות טובה בכמה וכמה רמות מכל השאר.
אני לא מדבר על הממשק המזעזע של קלוד לדוגמא, גם AIסטודיו לא מגיע בצורה נעימה במיוחד.
אני היחיד שחושב ככה?@משרדי AI סטודיו הוא לא מוצר שמכוון לקהל הרחב, והוא באמת עם UIUX גרוע מאוד
אני לא חושב שהממשק של קלוד מזעזע, אבל הוא לא משהו
אם כבר הממשק הכי טוב בשוק הוא בכלל של grok. דוגמה קטנה לחשיבה שלהם על פרטים קטנים - אתה יכול באמצע שהAI כותב להקליד תגובה ואנטר וזה קוטע אותו. זה חוויית שיחה הרבה יותר טבעית, אצל כל האחרים אתה צריך ללחוץ ידנית על כפתור עצור, לחכות שיעצור, וללחוץ שליחה