שימוש יעיל ב AI
-
מצטרף באיחור. אבל יכול לשתף מנסיוני, אני עובד במקביל עם קלוד GPT וגימיני בכולם אני משלם על פרימיום.
קלוד הוא מלך! הוא מגדיל ראש, הוא מביא הרבה דברים משלימים מעבר לבקשה שלך, הכל מטופל טוב. אין לו שני.
אבל הבעיה היא א. לפעמים אני מאבד אותו, וכמובן המגבלות זמן...
בדברים נקודתיים לפתור בעיה GPT מעולה אם ענה בפעם הראשונה לרוב כאשר בפעם הראשונה לא ענה טוב הוא ימשיך להמציא בביטחון ולשרוף שעות לפח. לפעמים באמת מוצא בסוף.
גימיני שעונה הכי מהר, נעזר בו לדברים פשוטים שאני מתעצל... -
openai שחררו מודלים חדשים, היתרון של כולם זה אורך הקשר גדול יותר של 1M קלט, ו32000 פלט, כמו כן הם מאומנים על חומר חדש יותר (עד יוני 2024)
GPT-4.1 זול יותר מO4
GPT-4.1 mini יקר יותר מgpt-4o-mini
GPT-4.1 nano זול ומהיר מאוד.בהשוואות מודלים באינטרנט נטען שGPT-4.1 יותר טוב מO4 בקידוד, ו GPT-4.1 mini טוב כמו O4 בקידוד.
בבדיקה שלי על עברית (תרגומים מאנגלית לעברית והשוואה שלהם ע"י מודל PRO 2.5) נראה שדווקא O4 מעט יותר טוב מ4.1, GPT-4.1 mini משתרך הרבה מאחוריהם אך עדיין טוב משמעותית מ gpt-4o-mini .
-
@אלי כתב בשימוש יעיל ב AI:
בהשוואות מודלים באינטרנט נטען שGPT-4.1 יותר טוב מO4 בקידוד, ו GPT-4.1 mini טוב כמו O4 בקידוד.
בבדיקה שלי על עברית (תרגומים מאנגלית לעברית והשוואה שלהם ע"י מודל PRO 2.5) נראה שדווקא O4 מעט יותר טוב מ4.1, GPT-4.1 mini משתרך הרבה מאחוריהם אך עדיין טוב משמעותית מ O4 mini.
אתה בודק את המודל על משימה שהוא לא נועד עבורה. זה לא מודל שאמור להיות חזק מבחינת שפה, זה מודל ייעודי לכתיבת קוד
-
מעניין כי זה מקבל באתרי ההשוואות דירוג לא רע גם מצד חוזק השפה.
בכל אופן היום openai שחררו עוד שני דגמים
O3
o4-mini (החליף את o3-mini בצא'ט)
וגם להם יהיה אפשרות של High Medium Low (אגב זה מודל אחר מ gpt-4o-mini אליו התיחסתי בהודעתי הקודמת- למעשה עם כל הדגמים השונים שלהם זה כבר מבלבל לגמרי...)
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.(בדקתי גם את שני הדגמים החדשים על תרגום לעברית. Medium O3 הפתיע לטובה עם בחירות מילים מאוד חכמות אבל עדיין יש בו חסרונות ואפ' טעויות כתיב לעומת O4, מאידך o4-mini Medium לא מתאים לזה בכלל והוא גרוע מ4.1 mini )
-
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
השאלה היא כמה חלון הקשר יש להם. כי ברגע שיש להם פחות ממיליון טוקנים שיש בגוגל (רק בAI סטודיו) זה כבר אמור להיות הרבה פחות טוב. ידע זה כח...
-
@one1010 כתב בשימוש יעיל ב AI:
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
השאלה היא כמה חלון הקשר יש להם. כי ברגע שיש להם פחות ממיליון טוקנים שיש בגוגל (רק בAI סטודיו) זה כבר אמור להיות הרבה פחות טוב. ידע זה כח...
חלון הקשר של 200,000.
@אלי כתב בשימוש יעיל ב AI:
שני הדגמים החדשים מקבלים את הדירוג הגבוה ביותר מבחינת קידוד - הרבה יותר מPRO 2.5, ובכך openai חוזרים להוביל על גוגל.
לא מדוייק. הם די דומים בביצועים ברוב הבנצ'מארקים. אם כי במדדים מסויימים הדגמים החדשים של OpenAI טובים משמעותית
(בדקתי גם את שני הדגמים החדשים על תרגום לעברית. Medium O3 הפתיע לטובה עם בחירות מילים מאוד חכמות אבל עדיין יש בו חסרונות ואפ' טעויות כתיב לעומת O4, מאידך o4-mini Medium לא מתאים לזה בכלל והוא גרוע מ4.1 mini )
אין שום טעם להשתמש בדגמי חשיבה עבור משימת תרגום.
תרגום מאנגלית לעברית היא משימה פשוטה מאוד, ש-gpt4o וכל דגם בסיס בגודל רגיל מסוגל לבצע אותה בקלות.
-
@NH-LOCAL כתב בשימוש יעיל ב AI:
תרגום מאנגלית לעברית היא משימה פשוטה מאוד, ש-gpt4o וכל דגם בסיס בגודל רגיל מסוגל לבצע אותה בקלות.
רוב מודלי החשיבה דווקא מתקשים יותר מהמודלים הרגילים.
לצורך תרגום איכותי ובחירת המילים הנכונה ביותר, נדרשת הבנה עמוקה מאוד של השפה, הבינה המלאכותית מתקשה (גם עם הנחיות מדויקות ומרחיבות) ביחס למתרגם מוכשר
לכן כשבאים לבחון את יכולת המודל בעברית ניתן לעשות זאת ע"י בקשת תרגום
הבה נקח משפט באנגלית לדוגמא
To the human eye, the mighty mountains of Northernmost Europe are a wonder to behold. But for the wild creatures who have the fells as their habitat, life there is as harsh as it gets.
O4
לעין האנושית, הרי הצפון הרחוק של אירופה הם מראה עוצר נשימה. אבל עבור חיות הבר שזהו בית הגידול שלהן, החיים שם קשים במיוחד.
Grok-3
לעין האנושית, ההרים האדירים של צפון אירופה הם פלא של ממש. אבל עבור היצורים הפראיים שחיים בגבעות כביתם, החיים שם קשים ביותר.
Claude 3.7 Sonnet
לעין האנושית, ההרים האדירים בצפון אירופה הם מחזה מרהיב. אך עבור חיות הבר שהרמות ההרריות הן ביתן, החיים שם קשים מנשוא.O4 (בתשובה הזאת) החסיר תרגום mighty
Grok-3 תרגם fells לגבעות נדמה לי שזה תרגום לא נכון (fells = אזורי הרים גבוהים וחשופים) המשפט "אבל עבור היצורים הפראיים שחיים בגבעות כביתם," לא הכי תקני
Claude 3.7 Sonnet עם תרגום "החיים שם קשים מנשוא" זה משפט ספרותי יותר אבל פחות מדויקזה משפט אחד, תחשוב שאתה מתרגם מסמך שלם, ברור שזה יבלוט יותר ויותר, Flash 2.0 לדוגמא תרגם "בעין אנושית" זה תרגום שעובר אבל פחות טוב מ "לעין האנושית" O4 בניסיון אחר תרגם " הרי הענק של צפון אירופה הקיצונית"...
-
@yossiz כתב בשימוש יעיל ב AI:
נקודה נוספת: לא לדבר איתו כמו בנאדם. זה מכונה, וכדאי לזכור את זה תמיד. אני רואה אנשים מתווכחים, מתלוצצים, מתבדחים, מבקשים חיזוקים מחמאות וטפיחות שכם, כל זה לא נכון ומגוחך. צריך לזכור שזה מכונה.
נכון ולא נכון,
אין ספק שהוא מכונה ולכן לא אמור להגיב אחרת אם אתה פונה בסגנון שונה,
אבל מאחר שהוא מנתח איך אנשים רגילים להגיב ביחס לסגנונות מסויימים ולפי זה עונה לך, זה כן משפיע.
כך על פי מחקרים בנושא.
מוזמן להאזין לפודקאסט הזה של יובל דרור
https://bit.ly/RobotHeartOsimTech