שימוש יעיל ב AI
-
הם הוסיפו השבוע את PRO 2.5 Experimental ל https://gemini.google.com, לא בדקתי אם הוא כמו בגוגל סטודיו בעיקר מבחינת הקשר טוקנים אבל ברור שיש שם עכ"פ את היתרון של שמירה אוטומטית
-
@אלי כתב בשימוש יעיל ב AI:
הם הוסיפו השבוע את PRO 2.5 Experimental ל https://gemini.google.com, לא בדקתי אם הוא כמו בגוגל סטודיו בעיקר מבחינת הקשר טוקנים אבל ברור שיש שם עכ"פ את היתרון של שמירה אוטומטית
מבחינת הקשר הטוקנים זה כפול- 2 מיליון.
ניסתי לשחק איתו קצת ולדעתי הוא גרוע בהרבה ממה שנמצא בAI סטודיו, מקשקש הרבה ולא תמיד יעיל כמו בAI סטודיו -
@one1010 כתב בשימוש יעיל ב AI:
@NH-LOCAL כתב בשימוש יעיל ב AI:
עדכון: ככל הנראה הבעיה בממשק תוקנה
הבעיה 'שלי'?
בהחלט.
@one1010 כתב בשימוש יעיל ב AI:
מבחינת הקשר הטוקנים זה כפול- 2 מיליון.
מה המקור שלך? ככל הנראה זה הרבה פחות עבור האתר של ג'מיני (יותר בכיוון של 32 אלף)
המודל באפליקצייה ובאתר גם מוגבל להחריד מבחינת כמות שאילתות ליום
-
@NH-LOCAL כתב בשימוש יעיל ב AI:
@one1010 כתב בשימוש יעיל ב AI:
@NH-LOCAL כתב בשימוש יעיל ב AI:
עדכון: ככל הנראה הבעיה בממשק תוקנה
הבעיה 'שלי'?
בהחלט.
יש מצב, אני עדיין עובד עם הקובץ טקסט אבל כבר הוספתי אחר כך עוד כמה מאות אלפים והוא עדיין עובד בצורה מצויינת.
@one1010 כתב בשימוש יעיל ב AI:
מבחינת הקשר הטוקנים זה כפול- 2 מיליון.
מה המקור שלך? ככל הנראה זה הרבה פחות עבור האתר של ג'מיני (יותר בכיוון של 32 אלף)
באופן אישי גם קיבלתי ממנו קודים נורא ארוכים רק לא יודע לומר האם באמת הוא עומד בהבטחות כי באמת בשלב מסויים הוא התחיל 'לבלבל את השכל'...
המודל באפליקצייה ובאתר גם מוגבל להחריד מבחינת כמות שאילתות ליום
הצטרפתי לחודש חינם אז לא שמתי לב לזה. בגוגל סטודיו עדיין לא הצלחתי לראות שום הגבלה ואני מדבר על מאות אלפים ליום...
-
@one1010 כתב בשימוש יעיל ב AI:
באופן אישי גם קיבלתי ממנו קודים נורא ארוכים רק לא יודע לומר האם באמת הוא עומד בהבטחות כי באמת בשלב מסויים הוא התחיל 'לבלבל את השכל'...
מגבלת 32,000 אסימונים יכולה להפיק לך קוד גם של עד 3000 שורות...
המקור שהבאת מדבר על משהו עתידי, וככל הנראה זה ישוחרר רק במסגרת ה-API וב-AI STUDIO בלבד.
@one1010 כתב בשימוש יעיל ב AI:
הצטרפתי לחודש חינם אז לא שמתי לב לזה. בגוגל סטודיו עדיין לא הצלחתי לראות שום הגבלה ואני מדבר על מאות אלפים ליום...
השימוש באתר ג'מיני מוגבל למשתמשים החינמיים, אם אתה מנוי זה עניין אחר.
ב-AI STUDIO יש גם מגבלות באופן תיאורטי, אבל גבוהות מאוד והם לא אוכפים אותם בצורה סדירה.
בכל מקרה, אין שום טעם לשלם על מנוי שלא נותן לך כלום חוץ ממגבלה גבוהה יותר עבור דיפ סרצ'
-
@NH-LOCAL כתב בשימוש יעיל ב AI:
@one1010 כתב בשימוש יעיל ב AI:
באופן אישי גם קיבלתי ממנו קודים נורא ארוכים רק לא יודע לומר האם באמת הוא עומד בהבטחות כי באמת בשלב מסויים הוא התחיל 'לבלבל את השכל'...
מגבלת 32,000 אסימונים יכולה להפיק לך קוד גם של עד 3000 שורות...
אולי אני לא מבין כ"כ, אבל אני דיברתי על 2.5 מיליון טוקנים של כל השיחה לא רק של תשובה אחת.
המקור שהבאת מדבר על משהו עתידי, וככל הנראה זה ישוחרר רק במסגרת ה-API וב-AI STUDIO בלבד.
לא נשמע, כי זה נכתב אחרי שבוע או שבועיים שזה כבר היה זמין בAI סטודיו ובדיוק כשזה הופץ לציבור בג'מיני.
@one1010 כתב בשימוש יעיל ב AI:
הצטרפתי לחודש חינם אז לא שמתי לב לזה. בגוגל סטודיו עדיין לא הצלחתי לראות שום הגבלה ואני מדבר על מאות אלפים ליום...
השימוש באתר ג'מיני מוגבל למשתמשים החינמיים, אם אתה מנוי זה עניין אחר.
ב-AI STUDIO יש גם מגבלות באופן תיאורטי, אבל גבוהות מאוד והם לא אוכפים אותם בצורה סדירה.
בכל מקרה, אין שום טעם לשלם על מנוי שלא נותן לך כלום חוץ ממגבלה גבוהה יותר עבור דיפ סרצ'
חשבתי שזה ייתן לי את אותו תועלת של AI סטודיו בלי הבעיה של האיטיות לכן נרשמתי לחודש חינם. אני בוודאי יבטל לפני שאחוייב.
-
-
מצטרף באיחור. אבל יכול לשתף מנסיוני, אני עובד במקביל עם קלוד GPT וגימיני בכולם אני משלם על פרימיום.
קלוד הוא מלך! הוא מגדיל ראש, הוא מביא הרבה דברים משלימים מעבר לבקשה שלך, הכל מטופל טוב. אין לו שני.
אבל הבעיה היא א. לפעמים אני מאבד אותו, וכמובן המגבלות זמן...
בדברים נקודתיים לפתור בעיה GPT מעולה אם ענה בפעם הראשונה לרוב כאשר בפעם הראשונה לא ענה טוב הוא ימשיך להמציא בביטחון ולשרוף שעות לפח. לפעמים באמת מוצא בסוף.
גימיני שעונה הכי מהר, נעזר בו לדברים פשוטים שאני מתעצל... -
openai שחררו מודלים חדשים, היתרון של כולם זה אורך הקשר גדול יותר של 1M קלט, ו32000 פלט, כמו כן הם מאומנים על חומר חדש יותר (עד יוני 2024)
GPT-4.1 זול יותר מO4
GPT-4.1 mini יקר יותר מgpt-4o-mini
GPT-4.1 nano זול ומהיר מאוד.בהשוואות מודלים באינטרנט נטען שGPT-4.1 יותר טוב מO4 בקידוד, ו GPT-4.1 mini טוב כמו O4 בקידוד.
בבדיקה שלי על עברית (תרגומים מאנגלית לעברית והשוואה שלהם ע"י מודל PRO 2.5) נראה שדווקא O4 מעט יותר טוב מ4.1, GPT-4.1 mini משתרך הרבה מאחוריהם אך עדיין טוב משמעותית מ gpt-4o-mini .
-
@אלי כתב בשימוש יעיל ב AI:
בהשוואות מודלים באינטרנט נטען שGPT-4.1 יותר טוב מO4 בקידוד, ו GPT-4.1 mini טוב כמו O4 בקידוד.
בבדיקה שלי על עברית (תרגומים מאנגלית לעברית והשוואה שלהם ע"י מודל PRO 2.5) נראה שדווקא O4 מעט יותר טוב מ4.1, GPT-4.1 mini משתרך הרבה מאחוריהם אך עדיין טוב משמעותית מ O4 mini.
אתה בודק את המודל על משימה שהוא לא נועד עבורה. זה לא מודל שאמור להיות חזק מבחינת שפה, זה מודל ייעודי לכתיבת קוד
-
מעניין כי זה מקבל באתרי ההשוואות דירוג לא רע גם מצד חוזק השפה.
בכל אופן היום openai שחררו עוד שני דגמים
O3
o4-mini (החליף את o3-mini בצא'ט)
וגם להם יהיה אפשרות של High Medium Low (אגב זה מודל אחר מ gpt-4o-mini אליו התיחסתי בהודעתי הקודמת- למעשה עם כל הדגמים השונים שלהם זה כבר מבלבל לגמרי...)
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.(בדקתי גם את שני הדגמים החדשים על תרגום לעברית. Medium O3 הפתיע לטובה עם בחירות מילים מאוד חכמות אבל עדיין יש בו חסרונות ואפ' טעויות כתיב לעומת O4, מאידך o4-mini Medium לא מתאים לזה בכלל והוא גרוע מ4.1 mini )
-
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
השאלה היא כמה חלון הקשר יש להם. כי ברגע שיש להם פחות ממיליון טוקנים שיש בגוגל (רק בAI סטודיו) זה כבר אמור להיות הרבה פחות טוב. ידע זה כח...
-
@one1010 כתב בשימוש יעיל ב AI:
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
השאלה היא כמה חלון הקשר יש להם. כי ברגע שיש להם פחות ממיליון טוקנים שיש בגוגל (רק בAI סטודיו) זה כבר אמור להיות הרבה פחות טוב. ידע זה כח...
חלון הקשר של 200,000.
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
לא מדוייק. הם די דומים בביצועים ברוב הבנצ'מארקים. אם כי במדדים מסויימים הדגמים החדשים של OpenAI טובים משמעותית
(בדקתי גם את שני הדגמים החדשים על תרגום לעברית. Medium O3 הפתיע לטובה עם בחירות מילים מאוד חכמות אבל עדיין יש בו חסרונות ואפ' טעויות כתיב לעומת O4, מאידך o4-mini Medium לא מתאים לזה בכלל והוא גרוע מ4.1 mini )
אין שום טעם להשתמש בדגמי חשיבה עבור משימת תרגום.
תרגום מאנגלית לעברית היא משימה פשוטה מאוד, ש-gpt4o וכל דגם בסיס בגודל רגיל מסוגל לבצע אותה בקלות.
-
@NH-LOCAL כתב בשימוש יעיל ב AI:
תרגום מאנגלית לעברית היא משימה פשוטה מאוד, ש-gpt4o וכל דגם בסיס בגודל רגיל מסוגל לבצע אותה בקלות.
רוב מודלי החשיבה דווקא מתקשים יותר מהמודלים הרגילים.
לצורך תרגום איכותי ובחירת המילים הנכונה ביותר, נדרשת הבנה עמוקה מאוד של השפה, הבינה המלאכותית מתקשה (גם עם הנחיות מדויקות ומרחיבות) ביחס למתרגם מוכשר
לכן כשבאים לבחון את יכולת המודל בעברית ניתן לעשות זאת ע"י בקשת תרגום
הבה נקח משפט באנגלית לדוגמא
To the human eye, the mighty mountains of Northernmost Europe are a wonder to behold. But for the wild creatures who have the fells as their habitat, life there is as harsh as it gets.
O4
לעין האנושית, הרי הצפון הרחוק של אירופה הם מראה עוצר נשימה. אבל עבור חיות הבר שזהו בית הגידול שלהן, החיים שם קשים במיוחד.
Grok-3
לעין האנושית, ההרים האדירים של צפון אירופה הם פלא של ממש. אבל עבור היצורים הפראיים שחיים בגבעות כביתם, החיים שם קשים ביותר.
Claude 3.7 Sonnet
לעין האנושית, ההרים האדירים בצפון אירופה הם מחזה מרהיב. אך עבור חיות הבר שהרמות ההרריות הן ביתן, החיים שם קשים מנשוא.O4 (בתשובה הזאת) החסיר תרגום mighty
Grok-3 תרגם fells לגבעות נדמה לי שזה תרגום לא נכון (fells = אזורי הרים גבוהים וחשופים) המשפט "אבל עבור היצורים הפראיים שחיים בגבעות כביתם," לא הכי תקני
Claude 3.7 Sonnet עם תרגום "החיים שם קשים מנשוא" זה משפט ספרותי יותר אבל פחות מדויקזה משפט אחד, תחשוב שאתה מתרגם מסמך שלם, ברור שזה יבלוט יותר ויותר, Flash 2.0 לדוגמא תרגם "בעין אנושית" זה תרגום שעובר אבל פחות טוב מ "לעין האנושית" O4 בניסיון אחר תרגם " הרי הענק של צפון אירופה הקיצונית"...