@יעקב-ישראל חוששני שאתה מערבב בין כמה דברים, הפריצה של צ'אט GPT מידג'רני ודומיהם היא בעיקרה בהבנת הטקסט ויצירתו עם הקשר, ופחות במובן של לזהות ולסווג אובייקטים בתמונה, זה אמנם משליך ישירות על הבנת הקונטקסט של התמונה לפי מכלול האובייקטים וחשיבותם בתמונה, אבל הזיהוי עצמו לא התקדם בפריצת דרך יותר מהמקום שהוא היה לפני שנה..
ואני לא אומר שזה לא מתאים לבדיקת תמונות, מניסיון שלי על מנוע זיהוי התמונות של גוגל (מלפני כשנה), הוא לא פספס אפילו פעם אחת מתוך כ100 תמונות אנשים בתמונות, הוא התבלבל במינים, הדגיש פריטים שוליים, אבל בהבנת ההקשר הוא הצליח ב80% ובכל התמונות שהיה אנשים הוא זיהה את זה, אמנם היו 3 תמונות שהוא "מצא" אנשים לא קיימים.
יש לגוגל דף ניסיון שאפשר פשוט להעלות תמונות ולקבל ניתוח תמציתי וגם מקיף על התמונה ומרכיביה. (או פשוט גוגל לנס, הוא גם עושה עבודה לא רעה בכלל סרקתי לו תמונה של ציפור עפה בשמים, מפוקסלת והוא זיהה את סוג האווז המדוייק!)