הפעלת Ray Operator ב-Google Kubernetes Engine ‏ (GKE)

בדף הזה מוסבר איך להפעיל את Ray operator ל-Google Kubernetes Engine‏ (GKE), כדי שתוכלו להשתמש ב-KubeRay APIs כדי לשנות את הגודל של אשכולות Ray ולנהל אותם. מידע נוסף על Ray ו-KubeRay זמין במאמר סקירה כללית על Ray ב-GKE.

לפני שמתחילים

לפני שמתחילים, חשוב לוודא שביצעתם את הפעולות הבאות:

  • מפעילים את ממשק Google Kubernetes Engine API.
  • הפעלת Google Kubernetes Engine API
  • אם רוצים להשתמש ב-CLI של Google Cloud למשימה הזו, צריך להתקין ואז להפעיל את ה-CLI של gcloud. אם התקנתם בעבר את ה-CLI של gcloud, מריצים את הפקודה gcloud components update כדי לקבל את הגרסה העדכנית. יכול להיות שגרסאות קודמות של ה-CLI של gcloud לא יתמכו בהרצת הפקודות שמופיעות במסמך הזה.

הפעלת האופרטור Ray באשכול

אפשר להפעיל את Ray operator באשכולות חדשים או קיימים של Autopilot או Standard GKE באמצעות Google Cloud CLI,‏ Google Cloud מסוף Google Cloud או Terraform.

המסוף

  1. נכנסים לדף Google Kubernetes Engine במסוף Google Cloud .

    מעבר אל Google Kubernetes Engine

  2. לוחצים על יצירה ואז בקטע 'רגיל' או 'טייס אוטומטי' לוחצים על הגדרה.

  3. במהדורת Standard, בחלונית הניווט, בקטע אשכול, לוחצים על תכונות. ב-Autopilot, לוחצים על הגדרות מתקדמות.

  4. בקטע AI and Machine Learning (AI ולמידת מכונה), מסמנים את תיבת הסימון Enable Ray Operator (הפעלת Ray Operator).

  5. לוחצים על יצירה.

gcloud

רגילה

יוצרים אשכול רגיל עם Ray Operator מופעל.

gcloud container clusters create CLUSTER_NAME \
    --cluster-version=VERSION \
    --addons=RayOperator

טייס אוטומטי

יוצרים אשכול Autopilot עם Ray Operator מופעל.

gcloud container clusters create-auto CLUSTER_NAME \
    --cluster-version=VERSION \
    --enable-ray-operator

מחליפים את מה שכתוב בשדות הבאים:

  • CLUSTER_NAME: השם של האשכול החדש.
  • VERSION: גרסת GKE, שצריכה להיות ‎1.30.0-gke.1747000 ואילך. אפשר גם להשתמש באפשרות --release-channel כדי לבחור ערוץ הפצה. גרסת ברירת המחדל של ערוץ ההפצה צריכה להיות ‎1.30.0-gke.1747000 ואילך.

כדי להפעיל את האופרטור Ray באשכול קיים, משתמשים בפקודה gcloud container clusters update עם האפשרות --update-addons=RayOperator=ENABLED.

Terraform

בדוגמה הבאה של Terraform נוצר ומגודר אשכול Standard:

resource "google_container_cluster" "default" {
  name     = "gke-standard-regional-ray-operator"
  location = "us-west1"

  initial_node_count = 1

  release_channel {
    channel = "RAPID"
  }

  addons_config {
    ray_operator_config {
      enabled = true
      ray_cluster_logging_config {
        enabled = true
      }
      ray_cluster_monitoring_config {
        enabled = true
      }
    }
  }
}

מידע נוסף על שימוש ב-Terraform זמין במאמר תמיכה ב-Terraform ב-GKE.

ניהול גרסאות

ה-Ray Operator זמין בגרסאות המשניות הבאות של GKE עם גרסת KubeRay תואמת:

GKE Minor Version גרסת KubeRay
‫1.35 v1.5
1.34 v1.4
‫1.33 v1.3
‫1.32 v1.2
‫1.31 v1.2
‫1.30 v1.1
1.29 v1.1

איך מוודאים שהאופרטור Ray מופעל

אפשר לוודא שאופרטור Ray מופעל באשכול GKE מסוג Autopilot או Standard באמצעות ה-CLI של gcloud או מסוף Google Cloud .

המסוף

  1. נכנסים לדף Google Kubernetes Engine במסוף Google Cloud .

    מעבר אל Google Kubernetes Engine

  2. ברשימת האשכולות, לוחצים על שם האשכול שרוצים לאמת.

  3. בקטע Features (תכונות), מוודאים שתיבת הסימון Ray Operator (אופרטור Ray) מסומנת.

gcloud

תאר את האשכול:

gcloud container clusters describe CLUSTER_NAME

מחליפים את CLUSTER_NAME בשם האשכול.

הפלט אמור להיראות כך:

# Several lines omitted
addonsConfig:
  rayOperatorConfig:
    enabled: true

הפלט הזה מציין שהאופרטור Ray מופעל באשכול.

המאמרים הבאים