קריאה אסינכרונית משרת HTTP בGO
-
@yossiz אני שואל איך יכול להיות שהnumber נהרס ע"י גישה ישירה לזיכרון לtype של הctx.
הרי הוא עותק. שהרי כשאתה משים משתנה מחרוזת למשתנה אחר זה כן כתובת שונה ותוכן בלתי תלוי, אז מה זה שונה.
בכל מקרה גם בשימוש בunsafe לא מתקבל על הדעת שיהיה דרך בשפה עילית מודרנית לשנות ערכים של זיכרון שלא באחריות הקוד שלי, אני ממש לא מבין איך זה ייתכן.
אני מבין שאני מפספס משהו, מה קורה כעושים number:= ctx.XXX. -
@dovid אמר בקריאה אסינכרונית משרת HTTP בGO:
שהרי כשאתה משים משתנה מחרוזת למשתנה אחר זה כן כתובת שונה ותוכן בלתי תלוי, אז מה זה שונה
הבייטים של המחרוזת הם אותם בייטים, אממה הכתובת של המשתנה הוא לא הכתובת של הבייטים אלא הכתובת של המצביע. (ומכיון ש-string ב-GO הוא immutable - בלי משחקים ב-unsafe - זה בטוח לגמרי, אבל ברגע שמשחקים עם הבייטים עצמם על ידי קוד unsafe כאן יתחילו בעיות)
תעשה ניסוי קטן:
package main import ( "fmt" "unsafe" ) func main() { b := []byte("ABC") s := *(*string)(unsafe.Pointer(&b)) s2 := s s3 := string(b) // this is safe (it makes a copy of the original bytes) b[0] = 'X' b[1] = 'Y' b[2] = 'Z' fmt.Println(s) fmt.Println(s2) fmt.Println(s3) }
https://play.golang.org/p/EpPwsoM-z8g
זה פחות או יותר מה שקורה בתוכנה של @nigun
-
@yossiz
נראה לי שעכשיו הבנתי קצת מה קורה כאן
המשתנה number הוא מערך של bytes
והוא מצביע על מערך אחר של bytes (שנמצא בCtx ???)
כשאני מדפיס בפעם הראשונה את number זה מיד אחרי שקראתי לfunc(c *fiber.Ctx)
ולפני שנעשה קריאה חדשה לfunc(c *fiber.Ctx)
ולכן הוא מדפיס את הערך האחרון (שהוא הנכון)
אבל בפעם השניה הערך הוא המערך במקורי הוא[57 49]
שזה "19" (כי זה היה הקריאה האחרונה)
אבל המצביע number נשאר עם מערך של איבר אחד
לכן הוא ממיר לסטרינג רק את האיבר הראשון במערך ולכן הוא מדפיס "1"
עד שהוא מגיע למערכים בני שני איברים (כי בקריאה המקורית זה היה עם שני ספרות) ואז הוא מדפיס "19"
והסיבה שהוא נשאר מצביע ולא משתנה חדש זה בגלל שהוא נוצר עם unsafe (שנשאר להצביע תמיד על הכתובת הראשונה)`
-
@nigun עד כמה שחשבתי עד היום...
אני כעת בדקתי וזה אכן קורה גם בC#:void Main() { var t = new strTest(); var str = t.GetStr(); t.Change(); Console.WriteLine(str); } public class strTest { string str = "ABC"; public string GetStr() => str; public void Change() { unsafe { fixed (char* p = str) p[0] = 'a'; } } }
אכן לא תמיד חוסר ידע שלי זה אשמת השפות
-
@nigun אמר בקריאה אסינכרונית משרת HTTP בGO:
נראה לי שעכשיו הבנתי קצת מה קורה כאן
בגדול אני מסכים עם ההסבר למרות שהייתי משנה טיפה את הנוסח.
המשתנה number הוא מערך של bytes
והוא מצביע על מערך אחר של bytesהמשתנה number הוא string. ותמיד משתנה מסוג string ב-GO הוא struct שיש בו 2 שדות, 1) מצביע לבייטים של המחרוזת 2) מספר שאומר מה אורך המחרוזת (כמה בייטים לקחת מהמיקום ששדה 1 מצביע עליו)
עכשיו, אם אתה מייצר סטרינג רגיל, סביבת ההרצה דואגת שהסטרינג יהיה immutable (שאין דרך - בלי קוד unsafe - לשנות את הערכים של הבייטים שעליו הוא מצביע), ולכן, אם סביבת ההרצה רואה שיצרת ממערך בייטים שהוא הרי mutable, הוא ידאוג להעתיק את הבייטים המקוריים למיקום חדש שלא ניתן לגישה מקוד רגיל, אבל אם ייצרת אותו ממערך בייטים עם המילה unsafe זה כאילו להגיד לסביבת ההרצה "אל תדאג, אני יודע מה אני עושה, אל תתערב לי" ואז אפשר לשנות את המערך המקורי ובזה לשנות את המחרוזת שהסטרינג ידפיס.עד שהוא מגיע למערכים בני שני איברים (כי בקריאה המקורית זה היה עם שני ספרות) ואז הוא מדפיס "19"
יפה! לנקודה הזאת לא שמתי לב, זה החלק שהיה חסר לי בפאזל.
והסיבה שהוא נשאר מצביע ולא משתנה חדש זה בגלל שהוא נוצר עם unsafe
לא ממש מדוייק, תמיד string יהיה מצביע, אבל כנ"ל באריכות, ההבדל הוא אם הוא מצביע למיקום שנגיש מקוד אחר או לא
מקוה שהסברתי ברור...
-
@nigun אמר בקריאה אסינכרונית משרת HTTP בGO:
בדקתי עכשיו מה קורה אם אני משתמש בשרת fasthttp שעליו פיבר מבוסס (הוא גם משתמש בctx)
ושם התוצאה תקינה
כנראה שהבעיה היא בפיברעיין כאן איך אפשר לממש את הבאג גם ב-fasthttp.
הדוגמה שלך עובד טוב כי הפונקציה string מייצר string חדש בצורה בטוחה.@dovid אמר בקריאה אסינכרונית משרת HTTP בGO:
אני כעת בדקתי וזה אכן קורה גם בC#:
השימוש במילת unsafe מחזיר אותך אחורה לימי ה-C שיש לך שליטה מלאה על כל מרחב הזיכרון של התהליך
ב-JS אסור בהחלט שזה יקרה כי כך יהיה אפשר לפרוץ החוצה מארגז החול של הדפדפן, ולכן באמת אין unsafe ב-JS. -
@yossiz אמר בקריאה אסינכרונית משרת HTTP בGO:
לא ממש מדוייק, תמיד string יהיה מצביע, אבל כנ"ל באריכות, ההבדל הוא אם הוא מצביע למיקום שנגיש מקוד אחר או לא
תודה על כל ההסברים המדוייקים
רק לא הבנתי את הקטע האחרון
האם כל פעם שאני יוצר סטרינג חדש (רגיל) הוא מצביע לכתובת חדשה, ואם משתמשים בunsafe אז הוא מצביע על המקורי
או שזה עובד אחרת? -
@nigun אמר בקריאה אסינכרונית משרת HTTP בGO:
האם כל פעם שאני יוצר סטרינג חדש (רגיל) הוא מצביע לכתובת חדשה, ואם משתמשים בunsafe אז הוא מצביע על המקורי
או שזה עובד אחרת?זה עובד אחרת, זה תלוי אם
סביבת ההרצההקומפיילר חוששת שהבייטים ישתנו, משום שלכל סטרינג יש חוזה (implicit contract) שהוא לא הולך להשתנות (immutable), וסביבת ההרצההקומפיילר דואגת לאכוף את זה. (אבל בשימוש ב-unsafe אתה אומר לסביבת ההרצהקומפיילר "אל תדאג, אני יודע מה אני עושה, אל תתערב לי")
(אפשר לבדוק את זה על ידי הדפסת תוכן אובייקט ה-string כמו כאן)
(או שאפשר לקרוא את קוד המקור שלסביבת ההרצההקומפיילר...)package main import ( "fmt" "reflect" "unsafe" ) func main() { b := []byte("ABC") s := *(*string)(unsafe.Pointer(&b)) // מצביע על הבייטים המקוריים s2 := s // עדיין מצביע על הבייטים המקוריים s3 := string(b) // מעתיק את הבייטים המקוריים ומצביע על המיקום של הבייטים החדשים s4 := s3 // לא מעתיק את הבייטים המקוריים כי סביבת ההרצה בטוח שהבייטים המקוריים לא ישתנו s5 := string(s4) // עדיין לא מעתיק וכנ"ל dumpStringAddr(s) dumpStringAddr(s2) dumpStringAddr(s3) dumpStringAddr(s4) dumpStringAddr(s5) } func dumpStringAddr(s string) { address := (*reflect.StringHeader)(unsafe.Pointer(&s)).Data fmt.Printf("%08x\n", address) }
-
@yossiz
מה הצורה הכי נוחה ליצור משתנה חדש אחרי שכבר המשתנה הקודם נשמר בunsafe
אני עשיתי המרה לביטים ואז המרה חזרה לסטרינג השאלה האם יש משהו יותר אלגנטי?app.Get("/:number", func(c *fiber.Ctx) { number := c.Path() str := []byte(number) go myfunc(string(str) )
-
@dovid אמר בקריאה אסינכרונית משרת HTTP בGO:
הרי אם הוא משרשר את זה, אז בהכרח נוצרת כתובת חדשה, לא
לכאורה לא. כי זה אותו מחרוזת, למה ליצור כתובת חדשה.
(https://play.golang.org/p/BuugrOW8xuy)כמו"כ אני ניסיתי את הדוגמה הראשונה של פייבר עם שרשור וזה היה בסדר גמור. זה לא אותו נידון?
ניסיתי עכשיו על ידי שינוי שורה 14 ל-
number := c.Params("number") + ""
והתוצאה לא בסדר. (או שאנחנו לא מבינים אחד את השני ומדברים על דברים שונים?)
-
למה ליצור חדש? כי אין לו בכלל מקום במיקום המקורי אולי. לא יודע. הנה בדוגמה שלך זה יוצר חדש כשהשרשור לא ריק.
בבדיקה שלי המחרוזת ששירשרתי לא היתה ריקה, ולכן זה עבד, ככה:package main import ( "fmt" "time" "github.com/gofiber/fiber" ) func main() { app := fiber.New() app.Get("/:number", func(c *fiber.Ctx) { number := c.Params("number") + " " go myfunc(number) c.Send(number) }) app.Listen(3000) } func myfunc(number string) { fmt.Printf("number is %s \n", number) time.Sleep(1 * time.Second) fmt.Printf("number is now %s \n", number) }
-
@yossiz
הם עכשיו הוציאו גירסה חדשה (למה הם התחילו מגירסה 1.0 ולא 0.1? זה כבר שאלה אחרת)
שבה הם הוסיפו את האפשרות שכל הסטרינגים יהיו Immutable
זה טוב, אבל נראה לי שהברירת מחדל צריך להיות הפוך ומי שרוצה יוכל להשתמש בunsafe
גם יהיה נחמד אם יהיה אפשרות לשלב את שני הסוגים באותו שרת
למשל שפשוט יחזירו bytes והלקוח ימיר את זה כרצונו.
(אני לא כותב את זה בשרשור בגיטהאב כי אני לא בטוח שמה שאני אומר זה נכון) -
@nigun לכאורה אני מסכים לטענותיך
(אני גם לא הולך לכתוב, א) ענין כזה שהוא לא טכני גרידא אלא ענין של טעם וניסיון וכו' אני לא מחזיק את עצמי כמייבין ב) אם זה היה נוגע אלי והייתי רואה פרוייקט חדש שהולך בכיוון לא טוב, לא הייתי משקיע בו יותר מדי, חכה עד שזה יהיה production ready או שימות מיתה טבעית) -