MLOps on Gemini Enterprise Agent Platform

בקטע הזה מוסבר על השירותים של Gemini Enterprise Agent Platform שעוזרים לכם להטמיע פעולות של למידת מכונה (MLOps) בתהליך העבודה של למידת מכונה (ML).

אחרי שמבצעים פריסה של המודלים, הם צריכים להתעדכן בנתונים משתנים מהסביבה כדי לפעול בצורה אופטימלית ולהישאר רלוונטיים. MLOps הוא אוסף של שיטות עבודה שמשפרות את היציבות והמהימנות של מערכות למידת מכונה.

הכלים של Gemini Enterprise Agent Platform MLOps עוזרים לכם לשתף פעולה בין צוותי AI ולשפר את המודלים שלכם באמצעות ניטור מודלים חיזויים, התראות, אבחון והסברים מעשיים. כל הכלים מודולריים, כך שאפשר לשלב אותם במערכות הקיימות לפי הצורך.

מידע נוסף על MLOps זמין במאמרים Continuous delivery and automation pipelines in machine learning ו-Practitioners Guide to MLOps.

תרשים של יכולות MLOps

  • ארגון תהליכי עבודה: אימון והצגה של המודלים באופן ידני יכולים להיות תהליכים ארוכים שמועדים לשגיאות, במיוחד אם צריך לחזור על התהליכים האלה הרבה פעמים.

  • ניהול של משימות אימון והרחבה שלהן: ניהול יעיל של משאבי מחשוב לאימון הוא אתגר מרכזי ב-MLOps, במיוחד כשמבצעים שינוי קנה מידה מניסויים לייצור. ‫Vertex AI Training נותן מענה לצורך הזה באמצעות שירותים גמישים ומנוהלים במלואם עם אפשרויות מחשוב שמתאימות לכל מחזור החיים של למידת מכונה.

    • לניסויים ולעומסי עבודה משתנים, הדרכה בהתאמה אישית כוללת את פלטפורמת ברירת המחדל ללא שרת (serverless) שמקצה משאבים לפי דרישה, ומציעה גמישות מקסימלית.

    • עבור עומסי עבודה צפויים בקנה מידה גדול, אשכולות האימון של Gemini Enterprise Agent Platform באשכולות ��מורים מספקים סביבה ייעודית וקבועה שמבטיחה ז��י��ות של משאבים, מספקת ביצועים יציבים ועוזרת לייעל את העלויות לצוותים עם שימוש גבוה.

  • מעקב אחרי המטא-נתונים שמשמשים במערכת ה-ML: במדעי הנתונים, חשוב לעקוב אחרי הפרמטרים, הארטיפקטים והמדדים שמשמשים בתהליך העבודה של ה-ML, במיוחד כשחוזרים על תהליך העבודה כמה פעמים.

    • Vertex ML Metadata מאפשר לכם לתעד את המטא-נתונים, הפרמטרים והארטיפקטים שבהם נעשה שימוש במערכת למידת המכונה (ML). אחרי כן, תוכלו לשלוח שאילתות למטא-נתונים האלה כדי לנתח את הביצועים של מערכת ה-ML או של הארטיפקטים שהיא יוצרת, לנפות באגים ולבצע ביקורת.
  • זיהוי המודל הכי טוב לתרחיש שימוש: כשמנסים אלגוריתמים חדשים לאימון, צריך לדעת איזה מודל מאומן מניב את הביצועים הכי טובים.

    • Vertex AI Experiments מאפשר לכם לעקוב אחרי ארכיטקטורות שונות של מודלים, היפר-פרמטרים וסביבות אימון ולנתח אותם, כדי לזהות את המודל הכי טוב לתרחיש השימוש שלכם.

    • Vertex AI TensorBoard עוזר לעקוב אחרי ניסויים בלמידת מכונה, להציג אותם חזותית ולהשוות ביניהם כדי למדוד את הביצועים של המודלים.

  • ניהול גרסאות של מודלים: הוספת מודלים למאגר מרכזי עוזרת לכם לעקוב אחרי גרסאות של מודלים.

    • Gemini Enterprise Agent Platform Model Registry מספק סקירה כללית של המודלים שלכם, כדי שתוכלו לארגן, לעקוב ולאמן גרסאות חדשות בצורה טובה יותר. ממרשם המודלים, אפשר להעריך מודלים, לפרוס מודלים לנקודת קצה, ליצור מסקנות אצווה ולראות פרטים על מודלים ספציפיים וגרסאות מודל.
  • ניהול תכונות: כשמשתמשים מחדש בתכונות של למידת מכונה בכמה צוותים, צריך דרך מהירה ויעילה לשתף ולהכניס את התכונות לשימוש בסביבת הייצור.

    • Vertex AI Feature Store הוא מאגר מרכזי שמאפשר לארגן, לאחסן ולהציג תכונות של למידת מכונה. שימוש במאגר תכונות מרכזי מאפשר לארגון לעשות שימוש חוזר בתכונות של למידת מכונה בהיקף גדול, ולקצר את הזמן שנדרש לפיתוח ולפריסה של אפליקציות חדשות של למידת מכונה.
  • מעקב אחרי איכות המודל: מודל שמוטמע בסביבת ייצור יפעל בצורה הכי טובה על נתוני קלט של הסקה שדומים לנתוני האימון. כשנתוני הקלט חורגים מהנתונים ששימשו לאימון המודל, הביצועים של המודל עלולים להידרדר, גם אם המודל עצמו לא השתנה.

    • המודל של פלטפורמת הסוכנים של Gemini Enterprise לניטור מודלים מנטר מודלים כדי לזהות הטיה בין נתוני האימון לנתוני ההסקה וסחף של הסקה, ושולח לכם התראות כשההטיה של נתוני ההסקה הנכנסים חורגת יותר מדי מקו הבסיס של האימון. אתם יכולים להשתמש בהתראות ובחלוקת התכונות כדי להעריך אם צריך לאמן מחדש את המודל.
  • התאמת קנה מידה של אפליקציות AI ו-Python: Ray היא מסגרת קוד פתוח להתאמת קנה מידה של אפליקציות AI ו-Python. ‫Ray מספקת את התשתית לביצוע מחשוב מבוזר ועיבוד מקבילי בתהליך העבודה של למידת מכונה (ML).

    • Ray on Agent Platform מיועד לאפשר לכם להשתמש באותו קוד Ray בקוד פתוח כדי לכת��ב תוכניות ולפתח אפליקציות ב-Gemini Enterprise Agent Platform עם שינויים מינימליים. לאחר מכן תוכלו להשתמש בשילובים של Gemini Enterprise Agent Platform עם שירותים אחרים Google Cloud כמו Vertex AI Inference ו-BigQuery כחלק מתהליך העבודה שלכם ללמידת מכונה (ML).

המאמרים הבאים