Ativar o complemento do operador Slurm para GKE

Este documento explica como ativar e desativar o complemento do operador Slurm para clusters do Google Kubernetes Engine (GKE). O complemento do operador Slurm só é compatível com clusters padrão. Ele não é compatível com clusters do Autopilot. O complemento do operador Slurm executa componentes no plano de controle do Kubernetes para gerenciar cargas de trabalho do Slurm no cluster.

Antes de começar

Antes de começar, verifique se você realizou as tarefas a seguir:

  • Ativar a API Google Kubernetes Engine.
  • Ativar a API Google Kubernetes Engine
  • Se você quiser usar a Google Cloud CLI para essa tarefa, instale e, em seguida, inicialize a CLI gcloud. Se você instalou a CLI gcloud anteriormente, instale a versão mais recente executando o comando gcloud components update. Talvez as versões anteriores da CLI gcloud não sejam compatíveis com a execução dos comandos neste documento.

Ativar o complemento do operador Slurm em um cluster do GKE

É possível ativar o complemento do operador Slurm em clusters novos ou atuais do GKE Standard usando a Google Cloud CLI.

gcloud container clusters create CLUSTER_NAME \
    --location LOCATION \
    --cluster-version=VERSION \
    --addons=SlurmOperator

Substitua:

  • CLUSTER_NAME: o nome do novo cluster;
  • LOCATION: a região do cluster;
  • VERSION: a versão do GKE, que precisa ser 1.35.2-gke.1842000 ou mais recente. Também é possível usar a opção --release-channel para selecionar um canal de lançamento. O canal de lançamento precisa ter uma versão padrão de 1.35.2-gke.1842000 ou mais recente.

É possível ativar o complemento do operador Slurm em um cluster atual usando o gcloud container clusters update comando e anexando a --update-addons=SlurmOperator=ENABLED flag.

Verificar se o complemento do operador Slurm está ativado

É possível verificar se o complemento do operador Slurm está ativado em um cluster usando a CLI gcloud.

gcloud container clusters describe CLUSTER_NAME \
    --location=LOCATION

Substitua:

  • CLUSTER_NAME: o nome do novo cluster;
  • LOCATION: a região do cluster;

A saída será semelhante a esta:

# Several lines omitted
addonsConfig:
  slurmOperatorConfig:
    enabled: true

Essa saída indica que o complemento do operador Slurm está ativado para o cluster.

Desativar o complemento do operador Slurm para um cluster

Para desativar o complemento do operador Slurm em um cluster atual, execute o seguinte comando:

gcloud container clusters update CLUSTER_NAME \
    --location=LOCATION \
    --update-addons=SlurmOperator=DISABLED

Substitua:

  • CLUSTER_NAME: o nome do novo cluster;
  • LOCATION: a região do cluster;

Para verificar se o complemento do operador Slurm está desativado, execute novamente o comando gcloud container clusters describe. A seção slurmOperatorConfig vai mostrar enabled: false.

A seguir