במסמך הזה מפורטת סקירה כללית של בקשות למקום שמור לעתיד במצב יומן.
השתמשו בבקשות למקום שמור לעתיד במצב לוח שנה כדי לקבל משאבים שיש להם ביקוש גבוה, למשל כדי ליצור מכונות וירטואליות (VM) עם יחידות GPU או TPU מצורפות. כש-Compute Engine מאשר בקשה לשמירת מקום, הוא מקצה את המשאבים השמורים בתאריך ובשעה שציינתם, למשך עד 90 יום. Google Cloud אחר כך תוכלו להשתמש במשאבים שהוזמנו כדי ליצור מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מכונות וירטואליות עם TPU, ולהריץ את עומסי העבודה הבאים:
משימות אימון מראש של מודלים
משימות של כוונון עדין של מודלים
עומסי עבודה (workloads) של סימולציות מחשוב עתיר ביצועים (HPC)
עלייה צפויה לטווח קצר בעומסי עבודה (workloads) של הסקת מסקנות
מידע נוסף על דרכים אחרות לשריין משאבים ב-Compute Engine זמין במאמר בחירת סוג שריון.
יצירת בקשה במצב יומן
בקטעים הבאים מוסבר איך לראות את זמינות המשאבים, וגם אילו פרטים צריך לציין כשיוצרים בקשה למקום שמור לעתיד במצב לוח שנה.
הצגת הזמינות העתידית של משאבים
לפני שיוצרים בקשה למקום שמור לעתיד במצב יומן, אפשר לראות את הזמינות העתידית באזור של המשאבים הבאים:
למכונות וירטואליות של GPU או H4D, עד 60 ימים מראש
ל-TPU, עד 120 ימים מראש
Compute Engine משתמש בDynamic Workload Scheduler (DWS) כדי לראות מתי המשאבים שביקשתם זמינים. כשיוצרים בקשה, צריך לציין את המספר, הסוג ותקופת ההזמנה של המשאבים שאישרתם שהם זמינים. Google Cloud יש סיכוי גבוה יותר שהבקשה שלכם תאושר אם תספקו את המידע ��זה.
הגדרת מאפייני הבקשה
כשיוצרים בקשה למקום שמור לעתיד במצב לוח שנה, צריך לציין את המאפיינים הבאים:
מחיקה אוטומטית. המאפיין הזה קובע אם Compute Engine ימחק את שמירת המקום שנוצרה אוטומטית (שנוצרה אוטומטית) לבקשה שלכם בשעת הסיום, גם אם לא השתמשתם בכל המשאבים. כדי ליצור בקשה במצב יומן, צריך להפעיל את אפשרות המחיקה האוטומטית.
סוג הצריכה. המאפיין הזה מגדיר איך מכונות וירטואליות משתמשות בהזמנה שנוצרה אוטומטית. כשיוצרים בקשה במצב יומן, צריך לציין שרוצים ליצור הזמנות שמטרגטות קהלים ספציפיים. ההגדרה הזו אומרת שרק מכונות וירטואליות שמטרגטות את ההזמנה יכולות להשתמש בה.
סוג הפריסה. במאפיין הזה מגדירים את המיקום של המשאבים השמורים. מערכת Compute Engine שומרת משאבים לפי סוג המשאב:
כשיוצרים בקשה למכונות וירטואליות עם GPU או H4D, צריך לציין את סוג הפריסה הצפופה (
DENSE). ההגדרה הזו מציינת שיש להקצות משאבים בצפיפות כדי להקטין את זמן האחזור ברשת.ב-TPU, Compute Engine משתמש כברירת מחדל בסוג הפריסה הגמיש (
FLEXIBLE). ההגדרה הזו מציינת שיש לשריין משאבים כמה שיותר קרוב למועד ההזמנה, על בסיס המאמץ הטוב ביותר.
שם. השם של הבקשה, שחייב להיות ייחודי בפרויקט.
מספר המשאבים. מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות מסוג H4D או יחידות ה-TPU שרוצים לשריין בשעת ההתחלה שצוינה.
סטטוס התכנון. המאפיין הזה מגדיר אם הבקשה תישלח מיד אל Google Cloud לבדיקה, או אם היא תישמר כטיוטה ותישלח במועד מאוחר יותר. כשיוצרים בקשה במצב יומן, צריך לציין שהבקשה תישלח לבדיקה באופן מיידי.
מצב הזמנה. המאפיין הזה מגדיר את השיטה להזמנת משאבים, וצריך להגדיר אותו ל-
CALENDARעבור בקשה במצב יומן.שם ההזמנה. השם של המקום השמור ש-Compute Engine יוצר באופן אוטומטי אם Google Cloud הבקשה שלכם מאושרת.
סוג השיתוף. המאפיין הזה מגדיר אם פרויקטים אחרים בארגון יכולים להשתמש בשמירת המקום שנוצרה אוטומטית לבקשה שאושרה. אפשר לציין אחת מהאפשרויות הבאות:
פרויקט יחיד. רק הפרויקט שלכם יכול לצרוך את הקיבולת השמורה.
שותף. אפשר לשתף את הקיבולת השמורה עם עד 100 פרויקטים אחרים בארגון. אם תציינו את האפשרות הזו, תצטרכו לציין את הפרויקטים שבהם תרצו לשתף את בקשת שמירת המקום שנוצרה אוטומטית. מידע נוסף זמ��ן במאמר בנושא שיטות מומלצות לגבי הזמנות שיתופיות.
תקופת ההזמנה. התאריך והשעה שבהם Compute Engine מקצה את הקיבולת שביקשתם, ובהם תוכלו להשתמש בה. תקופת השמירה כוללת את הפעולות הבאות:
שעת התחלה. כשרוצים להתחיל להשתמש בקיבולת המוזמנת. בהתאם למשאבים שאתם מזמינים, שעת ההתחלה צריכה להיות לפחות אחת מהאפשרויות הבאות מרגע שאתם יוצרים ושולחים בקשה:
למכונות וירטואליות עם GPU ו-H4D: 87 שעות (שלושה ימים ו-15 שעות)
ל-TPU, שש שעות
שעת הסיום. כשהקיבולת שביקשתם כבר לא שמורה לכם. בשלב הזה, מערכת Compute Engine מוחקת את בקשת השריון שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות בשריון או מוחקת אותן בהתאם לפעולת הסיום שציינתם עבור המכונות הווירטואליות.
מאפייני משאב. דרישות החומרה של מכונות וירטואליות עם GPU, מכונות וירטואליות H4D או יחידות TPU שרוצים לשריין. מכונות וירטואליות יכולות להשתמש בהזמנה רק אם המאפיינים שלהן תואמים למאפיינים של ההזמנה. מידע נוסף זמין במאמר בנושא הדרישות לשימוש בהזמנות.
Zone. האזור שבו רוצים לשמור קיבולת.
תהליך בקשת בדיקה
כדי לשריין קיבולת באמצעות בקשה למקום שמור לעתיד במצב יומן, צריך ליצור את הבקשה ולשלוח אותה אל Google Cloud לצורך בדיקה. אחרי שיוצרים בקשה ושולחים אותה, Google Cloud בודקת אותה תוך דקה, ואז קורה אחד מהדברים הבאים:
Google Cloud מאשר את הבקשה: מערכת Compute Engine שומרת את המשאבים שביקשתם, ובתוך דקה אחרי האישור יוצרת באופן אוטומטי שמירת מקום ריקה. בזמן ההתחלה של הבקשה, Compute Engine מקצה את הקיבולת שביקשתם על ידי הגדלת מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות מסוג H4D או מעבדי ה-TPU בהזמנה.
בין אם תשתמשו בקיבולת ובין אם לא.נתקלתם בשגיאה. הבקשה נכשלה כי באזור של הבקשה אין מספיק משאבים. מומלץ לבדוק שוב את הזמינות של המשאבים בעתיד, ואז ליצור ולשלוח בקשה חדשה לבדיקה.
מחזור החיים של בקשה
בתרשים הבא מוצגים המצבים השונים ש-Compute Engine יכול להגדיר לבקשה לשמירת מקום לעתיד במצב יומן:
התרשים שלמעלה מציג את המצבים ואת רצף האירועים הבאים:
PENDING_APPROVAL: יצרתם בקשה לבדיקה ושלחתם אותה. תוך דקה, Google Cloud מאשר את הבקשה.APPROVED: Google Cloud אישר את הבקשה שלך. לאחר מכן, תוך דקה, מערכת Compute Engine יוצרת שמירת מקום ריקה ומשנה את מצב הבקשה ל-PROCURING.
PROCURING: מערכת Compute Engine מתזמנת את הקצאת המשאבים השמורים. כדי למנוע את הקצאת ההרשאות, אפשר לבטל את הבקשה אם היא עומדת באחד מהתנאים הבאים:מועד ההתחלה הוא יותר מ-30 ימים מהיום.
ביטלתם את הבקשה תוך 24 שעות אחרי האישור, ותאריך ההתחלה הוא לפחות ארבעה ימים אחרי האישור.
לפני שהבקשה מגיעה לשעת ההתחלה שלה, מצב הבקשה משתנה ל
PROVISIONING.
CANCELLED: ביטלת את הבקשה כשהיא הייתה במצבPROCURING. הפעולה הזו משחררת את הקיבולת שהזמנתם ולא תחויבו עליה. אפשר לשמור את הבקשה לעיון עתידי, או למחוק אותה אם אין בה יותר צורך.
PROVISIONING: מערכת Compute Engine מקצה את המשאבים השמורים על ידי הגדלת מספר המכונות הווירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מעבדי TPU ששמורים במקום שנוצר אוטומטית. כשהבקשה מגיעה לשעת ההתחלה שלה, מצב הבקשה משתנה לFULFILLED.
FULFILLED: מערכת Compute Engine הקצתה את המשאבים השמורים שלכם, ואתם מחויבים עליהם. אתם יכולים להשתמש במקום השמור שנוצר אוטומטית על ידי יצירת מכונות וירטואליות עד לשעת הסיום של הבקשה.
כשמגיעים לשעת הסיום של הבקשה, מערכת Compute Engine מוחקת את שמירת המקום שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שצורכות את שמירת המקום או מוחקת אותן בהתאם לפעולת הסיום שהוגדרה במכונות הווירטואליות. אתם יכולים לשמור את הבקשה במצב יומן לצרכי תיעוד, או למחוק אותה אם אתם כבר לא צריכים אותה.
ניצול הקיבולת שהוקצתה
אחרי ש- Google Cloud מאשר בקשה למקום שמור לעתיד במצב יומן, מערכת Compute Engine יוצרת באופן אוטומטי מקום שמור עם המאפיינים הבאים:
בשמירת המקום שנוצרה אוטומטית אין מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או יחידות TPU שמורות, ולכן אי אפשר להשתמש בה עדיין.
הבקשה שנוצרה אוטומטית מקבלת בירושה את המאפיינים של המכונה הווירטואלית או ה-TPU שצוינו בבקשה.
בזמן ההתחלה של הבקשה, Compute Engine מקצה את הקיבולת שביקשתם על ידי הגדלת מספר המכונות הווירטואליות עם GPU, המכונות הווירטואליות מסוג H4D או מעבדי ה-TPU בשמירת המקום שנוצרה אוטומטית. אחרי זה תוכלו להשתמש בהזמנה כדי ליצור מכונות וירטואליות עם GPU, מכונות וירטואליות מסוג H4D או מכונות וירטואליות עם TPU שעומדות בכל התנאים הבאים:
למכונות הווירטואליות ולהזמנה יש מאפיינים תואמים.
המכונות הווירטואליות מיועדות ספציפית לפרטי הבקשה.
המכונות הווירטואליות משתמשות במודל הקצאת משאבים שמוגבל להזמנה.
צריך להפסיק את הפעילות של המכונות הווירטואליות או למחוק אותן במועד הסיום של ההזמנה.
אפשר ליצור מכונות וירטואליות עד שההזמנה תנוצל במלואה או עד לשעת הסיום של הבקשה. בסיום התקופה שצוינה בבקשה, מערכת Compute Engine מוחקת את שמירת המקום שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות בשמירת המקום או מוחקת אותן.
מכסה
דרישות המכסה לבקשות למקום שמור לעתיד במצב יומן תלויות בסוג המכונה, באופן הבא:
סוגי מכונות GPU ו-TPU: לא נדרשת מכסה כדי לשריין קיבולת.
מכונות מסוג H4D: מכסת ה-CPU מתמלאת.
כשיוצרים מכונות וירטואליות על ידי ניצול קיבולת מוזמנת, צריך לוודא שיש לכם מכסה מספיקה לכל המשאבים שלא כלולים בהזמנה, כמו דיסקים או כתובות IP. אחרת, יצירת מכונות וירטואליות תיכשל.
תמחור
כשאתם יוצרים ושולחים בקשה למקום שמור לעתיד במצב יומן, ואנחנו מאשרים את הבקשה, אנחנו לא מחייבים אתכם באופן מיידי.Google Cloud במקום זאת, אתם צוברים חיובים כשמתרחשים הדברים הבאים:
Compute Engine מקצה את הקיבולת שביקשתם. כשהבקשה מגיעה למצב
FULFILLEDבשעת ההתחלה של הבקשה, תחויבו על המשאבים שהוקצו בהתאם לתמחור של DWS. במודל התמחור הזה, המחיר של vCPU, זיכרון, GPU ו-TPU מוזל בהשוואה למחיר הרגיל.אתם משתמשים במשאבים שלא נכללים בהזמנה. כשיוצרים מכונות וירטואליות שמשתמשות בהזמנה שנוצרה באופן אוטומטי, לא חלים חיובים נוספים על המשאבים שנעשה בהם שימוש. אתם מחויבים רק על משאבים שלא כלולים בהזמנה, כמו דיסקים או כתובות IP.
החיוב על המשאבים ששוריינו יפסיק בזמן הסיום של הבקשה. בשלב הזה, המערכת של Compute Engine מוחקת את שמירת המקום שנוצרה אוטומטית, ומפסיקה את הפעילות של מכונות וירטואליות שמשתמשות בשמירת המקום או מוחקת אותן, בהתאם לפעולת הסיום שהוגדרה להן.
מגבלות
בקטעים הבאים מוסבר על המגבלות שחלות על בקשות למקום שמור לעתיד במצב תצוגת לוח שנה.
מגבלות לכל הבקשות
כל הבקשות למקום שמור לעתיד במצב יומן מוגבלות באופן הבא:
אפשר לשריין משאבים לתקופה של יום אחד עד 90 ימים.
אחרי שתשלחו בקשה ו- Google Cloud יאשר אותה, יחולו המגבלות הבאות:
אפשר לבטל את הבקשה אם היא עומדת באחד מהתנאים הבאים:
מועד ההתחלה הוא יותר מ-30 ימים מהיום.
ביטלתם את הבקשה תוך 24 שעות אחרי האישור, ותאריך ההתחלה הוא לפחות ארבעה ימים אחרי האישור.
אפשר למחוק את הבקשה אחרי שמבטלים אותה או אחרי שהיא מסתיימת.
אי אפשר לשנות את הבקשה.
מגבלות על בקשות למכונות וירטואליות עם GPU או H4D
אפשר להזמין מכונות וירטואליות עם GPU או מכונות וירטואליות מסוג H4D רק באופן הבא:
אפשר לשריין את המספרים הבאים של מכונות וירטואליות בכל בקשה:
למכונות וירטואליות עם GPU, בין מכונה וירטואלית אחת ל-80 מכונות וירטואליות
למכונות וירטואליות מסוג H4D, בין מכונה וירטואלית אחת ל-256 מכונות וירטואליות
אפשר להזמין את סדרות המכונות הבאות:
אפשר ל��ריין מ��ונות וירטואליות ��ם GPU או H4D ��ק ב��זורים ��פציפיים. מידע נוסף:
למכונות וירטואליות עם GPU, אפשר לעיין במאמר בנושא מיקומים של GPU.
לגבי מכונות וירטואליות מסוג H4D, אפשר לעיין במאמר בנושא אזורים ותחומים זמינים.
אי אפשר להשתמש בתבנית של הגדרות מכונה כדי ליצור בקשות למכונות וירטואליות עם GPU או H4D.
מגבלות על בקשות למכונות וירטואליות של TPU
אפשר לשריין מכונות וירטואליות של TPU רק באופן הבא:
אפשר להזמין 1, 4, 8, 16, 32, 64, 128, 256, 512 או 1,024 שבבי TPU לכל בקשה.
אפשר להזמין מראש את הגרסאות הבאות של TPU:
אפשר להזמין TPU רק באזורים הבאים:
TPU7x:
us-central1-c
TPU v6e:
asia-northeast1-beurope-west4-aus-east5-aus-east5-bus-south1-ai1b
TPU v5p:
us-east5-a
מגבלות לכל ההזמנות שנוצרו אוטומטית
יש מגבלות על בקשות שנוצרות אוטומטית:
אפשר לשנות את ההזמנה רק באופן הבא:
כדי לאפשר או לא לאפשר למשימות של Vertex AI להשתמש בה.
אחרי שעת ההתחלה של שמירת המקום.
אי אפשר להחיל על ההזמנה הנחות תמורת התחייבות לשימוש (CUD) או הנחות על שימוש קבוע (SUD).
אי אפשר למחוק את ההזמנה. מערכת Compute Engine מוחקת אותה בשעת הסיום של ההזמנה.