Kubernetes : Problème de 'Taint' et 'Toleration'

Posté par laroche-luc le 09/10/2024
RÉSOLU

laroche-luc

Membre depuis le 20/07/2020

slt, je viens d'ajouter des nodes avec des GPU sur mon cluster. j'ai mis une taint pour que seuls mes jobs de ML aillent dessus, mais mes pods de ML restent en Pending alors que j'ai mis la toleration

tolerations:
- key: "gpu"
  operator: "Equal"
  value: "true"
  effect: "NoSchedule"

Commentaires

ollivier-thibault

Membre depuis le 20/05/2024

t'as vérifié que les labels des nodes correspondent bien à ce que cherche ton pod ?

mace-lorraine

Membre depuis le 03/06/2024

la `toleration` permet au pod d'être accepté sur le node, mais elle ne l'oblige pas à y aller. k8s peut quand même essayer de le mettre ailleurs. ajoute un `nodeselector` ou une `nodeaffinity` pour forcer le scheduler à choisir spécifiquement ces nodes gpu

laroche-luc

Membre depuis le 20/07/2020

exact, avec le nodeSelector en plus de la toleration, ils popent au bon endroit. merci !

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire