Sujet :

Kubernetes : Problème de 'Taint' et 'Toleration'

RÉSOLU

Liste des sujets Répondre Créer un sujet

laroche-luc

Membre depuis le 21/07/2024

slt, je viens d'ajouter des nodes avec des GPU sur mon cluster. j'ai mis une taint pour que seuls mes jobs de ML aillent dessus, mais mes pods de ML restent en Pending alors que j'ai mis la toleration

tolerations:
- key: "gpu"
  operator: "Equal"
  value: "true"
  effect: "NoSchedule"

ollivier-thibault

Membre depuis le 23/09/2024

t'as vérifié que les labels des nodes correspondent bien à ce que cherche ton pod ?

mace-lorraine

Membre depuis le 03/06/2024

la `toleration` permet au pod d'être accepté sur le node, mais elle ne l'oblige pas à y aller. k8s peut quand même essayer de le mettre ailleurs. ajoute un `nodeselector` ou une `nodeaffinity` pour forcer le scheduler à choisir spécifiquement ces nodes gpu

laroche-luc

Membre depuis le 21/07/2024

exact, avec le nodeSelector en plus de la toleration, ils popent au bon endroit. merci !

Répondre

vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire