ניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר
-
@google3 המוצא היחיד זה שתשלים את פער הידע שלך כדי שתוכל להיות המנהל.
(תוכל אפילו בינתיים לאפשר למתכנתים לעשות הכל אבל לכפות כללים, למשל לעבוד עם גיט פול בשביל לעדכן את השרת, כך שהכל חייב להיות מתועד בגיט, בהקדם האפשרי כדאי ליצור להם יוזר או כל דרך אחרת שבה הם יכולים לעשות רק שני פעולות: גיט פול, וריסטרט לאפליקציה. את כל הפער התחזוקת השרת תצטרך ללמוד, כמובן שבהתחלה תיעזר בהם ושיסבירו לך כל דבר מה זה עושה וכולי).
שום כלי בעולם לא יעזור לך באמת, יש הרבה כלים שאולי ישלו אותך.
דוקר וחבריו זה גלגול אחריות, בסוף תמיד יש אחראי עם רמת אמון גבוהה. -
@google3 אשאל אותך כך: יצא לך לחוות תקלות וdowntime שנבע מטעויות אנוש שיכלו להימנע אילו מישהו מקצועי יותר היה שולט בכל התשתיות שלך?
מה לדעתך כמות העובדים שאתה צריך להגיע אליה כדי להתחיל לעבוד מסודר? (רמז: אחד.)לעבוד מסודר זה בסך הכל להוסיף אוטומציה לכל מה שאפשר, להעביר את הכל דרך גיט ולוודא שתמיד התשתית שלך זמינה להתקנה בצורה אוטומטית, או סמי-אוטומטית.
כלומר רצף הוראות ברור להתקנה, כמה שיותר אוטומציה.
זה ההגדרה לגיבוי טוב, כמו שצוטט פה באיזה ת'רד אחר, גיבוי לא מספיק ללא יכולת שחזור שעובדת ויכולה להחזיר אותך לפעילות בזמן מוגדר.אתה לא צריך בהכרח איש DevOps על מלא, אתה צריך פרילנסר שידע להקים לך תשתית טובה לעבודה רציפה של המתכנתים שלך.
-
@google3 כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
אז לפעמים (או תמיד) הטכנאי צריך לראות מה הוא עושה בזמן אמת, וזה יכול להיות שינוי קטן. עם כל דבר צריך להיות תחת עניין של פתוח אחר, זה יקח פי שלושה יותר זמן.
נשמע שהמפתחים בודקים שהקוד עובד בפרודקשן.
אני למדתי בדרך הקשה שאין מנוס וכדי לפתח בצורה מסודרת צריך טסטים (וכל המרבה בטסטים הרי זה משובח)
בפועל יכול לצאת שעל כל שורת קוד יכתבו 10 שורות של טסטים אבל בסופו של דבר אתה מקבל שקט ואתה יודע שאם קוד עבר את הטסטים ככל הנראה אתה יכול להעלות אותו לשרת פרודקשן ויעבוד בפעם הראשונה בלי הפתעות ובלי שהמפתח נגע בשרת.
בVoIP קצת יותר קשה לכתוב טסטים כי אין כ"כ פריימרוקים מוכנים וזה לפעמים עובד בצורה אסינכרונית אבל יש מספיק כלים שאפשר לבנות אתם את כל הטסטים הנדרשים אבל זה מן הסתם דורש פיתוח. -
@dovid כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
שום כלי בעולם לא יעזור לך באמת, יש הרבה כלים שאולי ישלו אותך.
נראה שאני הפכתי כאן ליעד לשכנע
בסדר, אני שומע מה אתה אומרבאמת, השכנעת אותי ללמוד גיט (שכבר רציתי ללמוד מזמן, רק חיפשתי את הזמן לזה).
עכשיו, אם אתה יכול לשתף אותי עם "כלים שאולי יסייעו לך", אודה לך מאוד.וכמו שאתה מבין, גם אני עובד עם גיט, זה עדיין לא מענה למה שאני צריך.
כמו שאני יכול לראות כל גיבוי במקום אחד,
לראות את כל השרתים במקום אחד, מה המצב של CPU, SSD וכו'.
לראות כל השרתים מה המצב עם משתמשים (הלו גם לשרת פתוח צריך להיות משתמש) -
@google3 כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
כמו שאני יכול לראות כל גיבוי במקום אחד,
לראות את כל השרתים במקום אחד, מה המצב של CPU, SSD וכו'.
לראות כל השרתים מה המצב עם משתמשים (הלו גם לשרת פתוח צריך להיות משתמש)מצאתי שירות חינמי שנקרא zabbix
בחיפוש בגוגל נראה שיש לו הרבה אלטרנטיבות:
https://www.google.com/search?q=zabbix+alternative -
@aaron כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
@google3 אשאל אותך כך: יצא לך לחוות תקלות וdowntime שנבע מטעויות אנוש שיכלו להימנע אילו מישהו מקצועי יותר היה שולט בכל התשתיות שלך?
שוב, יש לי כמה פרויקטים ותלוי אל מה אתה שואל (יש מה מה שעדיין בשלב פתוח אבל יש שם לקחות לטסטים).
אבל התשובה כמעט תמיד שלא ודברים שצריכים לעבוד, עובדים.
לדגמא יש לי שירות של מספרים בכל העולם כבר 5 שנים והיה רק פעם אחת נפילה וזה היה בגלל חוסר ב-SSD.
אותה נפילה הייתה לי גם בשיחות יוצאות פעמיים בגלל חוסר ב-SSD.
כבר טיפלתי בשני המקרים, שימחוק הלוג שהוא יותר מחודש, אבל עם כל זה זה מה שחוסר לי מאוד אם יש לי מקום שאני יכול לראות כל השרתים והמצב איתם SPU SSD זה יכול לעזור לי המון
אגב, לגבי שיחות נכנסות, יש לנו גיבוי כיום עם שרת נוסף, כך שבכל מקרה של תקלה או ריבוט, המעבר הוא אוטומטי לשרת הגיבוי. השרת גיבוי מסנכרן את המידע כל 6 שעות לאחר שרת הראשון - ועובדים עכשיו לעשות את זה גם לשיחות יוצאות
-
@aaron כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
מה לדעתך כמות העובדים שאתה צריך להגיע אליה כדי להתחיל לעבוד מסודר? (רמז: אחד.)
אתה באצם צודק אין מי שחולר אילך אבל כמו שכבתי כבר למעלה כעת אני לא יכול
@google3 כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
עלות של אדם אמין בארה"ב לעבודה כזה היא כ-150,000 דולר לשנה, רק כדי להתחיל
רוב הפרויקטים עדיין בשלבי פיתוח, (אף על פי שחלקם מתקדמים עם לקחות כבר). כל דבר ידרוש עיבוד נוסף, מה שיכול לאט את הפרויקט באופן משמעותי. לא לדבר על חוסר בשני שרתים נפרדים לפיתוח ולפרודקשן, שאין לי בשלב זה, אז לפעמים (או תמיד) הטכנאי צריך לראות מה הוא עושה בזמן אמת, וזה יכול להיות שינוי קטן. עם כל דבר צריך להיות תחת עניין של פתוח אחר, זה יקח פי שלושה יותר זמן.
בנוסף להנ"ל יש לי המתכנטים בכל שעות היום, כך אני יצטרך לשלם לשני מנהלים ?
המתכנתים שלי, חלקם עובדים איתי כבר שנים, לא אוהבים את הרעיון שיצטרכו לשאול מישהו על כל דבר.
חלק המתכנתים שלי גם עושים DevOps/טכנאות, וכשיש תקלה הם טופלים בה
-
@google3 כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
נראה שאני הפכתי כאן ליעד לשכנע
לא הבנתי, עניתי לך על שאלה, אתה לא נשמע לי אסיר תודה.
נ.ב. מה נסגר עם העברית שלך? אתה נעזר בכותבים נוספים? אתה רגע כותב עברית צחה ורגע שאחריו קצת פחות.
-
@google3 כתב בניהול כ 20 שרתים עם צוות של 6 מתכנתים - תובנות וכלים שיכול לעוזר:
לדגמא יש לי שירות של מספרים בכל העולם כבר 5 שנים והיה רק פעם אחת נפילה וזה היה בגלל חוסר ב-SSD.
אני מדבר על טעויות אנוש במהלך פיתוח, לא ש5 שנים משהו רץ בפרודקשן בלי שינויים..
לניטור של שרתים אתה יכול להשתמש בnetdata או בgrafana עם node exporter, ביחד עם alerts. זאת האפשרות הטובה יותר לדעתי.