@יוסף-בן-שמעון כתב במודלי שפה בקוד פתוח - שימושים בתעשייה:
יש באזז רציני סביב פיתוחים של מודלי שפה בקוד פתוח.
השאלה שלי היא למה זה נועד בעצם.
אני מבין שמודלי סיווג זה דבר שימושי, בגלל שהפלט מגיע בתבנית צפויה, ואפשר לרתום אותם להחלטות אוטונומיות על ידי קוד שקורא את הפלט שלהם.
אבל למודל שפה אין פלט דטרמינסטי, ואפילו עם רג'קס אי אפשר לקרוא את הפלט, כך שלכאורה לא ניתן להשתמש בו לביצוע אוטונומי.
אמנם ישנם מודלים שתומכים ב function calling, אבל אני תוהה האם זו באמת הדרך היחידה להפיק תועלת מהעולם הענק של ה LLM? אם זה היה באמת כך זו היתה צריכה להיות דרישה התחלתית מכל מודל, שידע להפיק קריאה לפונקציות?
א. ניתן בהחלט "להכריח" את המודל להנפיק פלט במבנה JSON בהתאם לפורמט המדויק הרצוי, והאמינות של המודלים היא באיזור 100% כיום עבור הנפקת הפלט
ב. יש אינספור משימות של עיבוד טקסט פשוט, שמשמשים בתעשייה. הרבה לפני שימוש בכלים, MCP וקריאת פונקציות.
למשל:
זיהוי ואיסוף מידע בתוך מסמכים, כמו שם, סכום כסף, כתובת, וכו', הצריך בעבר שימוש במודלים ייעודיים שכונו מודלי NER, והדיוק שלהם היה מוגבל. כיום מודלי שפה יכולים לצלוח משימות כאלו בקלות
שילוב המודל עם RAG כדי לאסוף ולחפש מידע רלוונטי מתוך החברה
צ'אטים אוטומטיים עבור תמיכה ושירות לקוחות
כתיבה שיווקית וניסוח מיילים, מודעות וקמפיינים - מהעבודות היותר משמעותיות
העשרה נוספת כאן