האנטומיה של שאילתת SQL- תגובות

yossiz

אני צריך לתקן קצת במאמר שלי. כתבתי שאחרי קיבוץ אי אפשר להזכיר ערך של שורה ספציפית רק ערך של פונקציה שמסכמת באיזשהו צורה את כל השורות המקופלות בשורה זו. זה לא לגמרי נכון, כי אפשר להזכיר את הערך של העמודה שלפיה עשית את הקיבוץ מכיון שהערך שווה לכל השורות המקובצות. (בחלק מהמנועים אפשר להזכיר ערכים של עמודות אחרות אבל אין לזה משמעות ברורה).
אני לא יודע אם הדבר הזה בלבל אותך

משמע שזה משמש גם בשביל GROUP BY וגם בשביל שאר הערכים שמתקבלים מתוך פונקציה.

אני לא בטוח שאני מבין לאיזה שני דברים אתה מתכוון.

האם זה אומר שיש אופציה שישתמשו בHAVING בלי GROUP BY?

אפשר, אבל זה עושה קיפול מובן (implicit) של כל השורות לשורה אחת

nigun

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

אני לא בטוח שאני מבין לאיזה שני דברים אתה מתכוון.

group or aggregate

האם זה אומר שיש אופציה שישתמשו בHAVING בלי GROUP BY?

אפשר, אבל זה עושה קיפול מובן (implicit) של כל השורות לשורה אחת

לא הבנתי
נראה לי שאני צריך לנסות על טבלה אמיתית וזהו.

nigun

עכשיו נראה לי שעכשיו אני מבין
פשוט לא שייך לעשות aggregate אם אין group (אולי אפשר אבל אין לזה משמעות)

וחוץ מזה השאילתא

SELECT * FROM info GROUP BY user WHERE id > 10000;

לא תעבוד, כי אי אפשר לעשות WHERE אחרי הGROUP.

אבל השאילתא

SELECT * FROM info GROUP BY user HAVING id > 10000;

תעבוד.
וכנ"ל

SELECT * FROM info  HAVING id > 10000;

אז השאלה שלי עכשיו, למה לא להשתמש תמיד בHAVING ?

yossiz

@nigun אמר בהאנטומיה של שאילתת SQL- תגובות:

אבל השאילתא
SELECT * FROM info GROUP BY user HAVING id > 10000;
תעבוד.

ב-postgres זה לא יעבוד. גם במנועים אחרים אם זה יעבוד (ואני לא בטוח שזה חוקי בשום מנוע) לא יהיה לזה שום משמעות כי ה-id לא מוגדר אם לא עשית קיבוץ לפי id.

וכנ"ל
SELECT * FROM info HAVING id > 10000;

אז השאלה שלי עכשיו, למה לא להשתמש תמיד בHAVING ?

כנ"ל. HAVING בלי GROUP BY עושה קיבוץ אוטומטי של כל השורות לשורה אחת. אם כן ל-id אין משמעות

dovid

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

קיפול מובן (implicit)

מתרגמים את זה בד"כ "קמפול משתמע" או "קמפול מרומז".

nigun

@yossiz
שתי השאליתות עבדו לי יופי בMYSQL

yossiz

@nigun נראה שאתה צודק.
http://sqlfiddle.com/#!9/5ccdef/6/0
זו התנהגות לא סטנדרטית של mysql ועדיף לא להשתמש בה.

nigun

@yossiz
למה לא סטנדרתית
בתיעוד של SQL שהבאתי למעלה כתוב
When GROUP BY is not used, HAVING behaves like a WHERE clause

OdedDvir

@nigun אמר בהאנטומיה של שאילתת SQL- תגובות:

אז השאלה שלי עכשיו, למה לא להשתמש תמיד בHAVING ?

מבחינת יעילות, לענ"ד אין להשתמש ב HAVING אם אפשר להשתמש ב- WHERE, מפני שה-WHERE הוא מסנן מוקדם ברמת השורה, ומתבצע לפני הקיבוץ, וכך הקיבוץ מתבצע על קבוצה קטנה יותר (תוצאת ה-WHERE) לעומת זאת ה-HAVING הוא מסנן מאוחר ברמת קבוצה, ויתבצע על כל הרשומות.

nigun

@OdedDvir
אני שואל על מקרה שאין בו קיבוץ.

yossiz

@nigun זה היה נכון ב-SQL Server 2005, בתיעוד של הגירסה העדכנית כתוב כמו שאני כתבתי:

When GROUP BY is not used, there is an implicit single, aggregated group.

nigun

@yossiz
אז איך יראה התוצאה בSQL Server 2019
(לא הבנתי מה זה implicit).

אני מנחש שהם שינו את זה בגלל שזה גורם לחוסר אחידות בשימוש של HAVING
וכך גם שאר המנועים, אבל MYSQL החליטו להשאיר את זה משום מה.

OdedDvir

@nigun אמר בהאנטומיה של שאילתת SQL- תגובות:

(לא הבנתי מה זה implicit).

התרגום הוא "בלתי מפורש", דהיינו שנוצר קיבוץ בלתי מפורש עם קבוצה אחת
(כאילו השתמשנו בפירוש ב GROUP BY)

yossiz

@nigun אמר בהאנטומיה של שאילתת SQL- תגובות:

אז איך יראה התוצאה בSQL Server 2019

לא תראה תוצאה כי השאילתה לא חוקית כי אסור להזכיר עמודה שהוא לא חלק מה-group by אם לא על ידי פונקצית aggregation.
דוד תרגם את המילה implicit כ"משתמע" או "מרומז"

OdedDvir

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

דוד תרגם את המילה implicit כ"משתמע" או "מרומז"

לא שמתי לב...

nigun

@yossiz
יצאתי מבולבל

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

לא תראה תוצאה כי השאילתה לא חוקית כי אסור להזכיר עמודה שהוא לא חלק מה-group by אם לא על ידי פונקצית aggregation.

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

אפשר, אבל זה עושה קיפול מובן (implicit) של כל השורות לשורה אחת

יש תוצאה או לא?
ואיך נכנס לכאן implicit?

yossiz

@nigun אתה צודק, סתרתי את עצמי. כי לא בדקתי את ההתנהגות של כל המנועים וניסיתי לנחש מה יהיה ההתנהגות של mysql, הניחוש לא יצא כל כך מוצלח

יש תוצאה או לא?

אין.

ואיך נכנס לכאן implicit?

כי לא עשית קיבוץ בפירוש על ידי GROUP BY אז הקיבוץ הוא "לא מפורש" או "מרומז" או "משתמע" או איך שתקרא לזה... מזה שעשית סינון על התוצאה של הקיבוץ על ידי HAVING.

nigun

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

כי לא עשית קיבוץ בפירוש על ידי GROUP BY אז הקיבוץ הוא "לא מפורש" או "מרומז" או "משתמע" או איך שתקרא לזה... מזה שעשית סינון על התוצאה של הקיבוץ על ידי HAVING.

אז implicit זה סיבת השגיאה?

yossiz

@nigun בא נעשה פה סדר,
יש שינוי התנהגות בין mysql ל-sql server ו-postgres במקרה של HAVING בלי קיבוץ
mysql מתייחס לזה כ-where
השניים האחרים מתייחסים לזה כרמז שאתה רוצה קיבוץ ולכן כל השורות מתקפלות לשורה אחת מקובץ. זה ברור? ב-mysql תקבל שורות מרובות (אם יש יותר משורה אחת שעונה על הקריטיריונים), בשניים האחרים אתה לא תקבל יותר משורה אחת!!!
זה הבדל ראשון
עכשיו במקרה של שורה מקובצת מכמה שורות, יש גם הבדלי התנהגות בין המנועים אם מותר להזכיר שם עמודה שהוא לא חלק מהקיבוץ (למרות שאין לו ערך מוגדר אחרי הקיבוץ).
mysql מתייחס לזה בצורה סלחנית ומתיר את זה. (איזה ערך מוחזר? הרי השורה מקובצת מכמה שורות? אני לא יודע...)
postgres ו-sql server זורקים שגיאה.
אלו היסודות ואידך פירושא זיל גמור.

dovid

@yossiz אמר בהאנטומיה של שאילתת SQL- תגובות:

mysql מתייחס לזה בצורה סלחנית ומתיר את זה. (איזה ערך מוחזר? הרי השורה מקובצת מכמה שורות? אני לא יודע...)
postgres ו-sql server זורקים שגיאה.

https://dev.mysql.com/doc/refman/5.7/en/group-by-handling.html
אני מבין שהתוצאה עקבית (כל עוד אין שינוי שורות בטבלה) אך בלתי צפויה. זה בפועל חוסך גם ביצועים (אל תחפש לא MAX ולא MIN, תביא משהו וזהו) והמון תחביר מייגע... אבל השאילתה לא הכי קריאה והגיונית.

תחומים - פורום חרדי מקצועי

האנטומיה של שאילתת SQL- תגובות