Membre depuis le 20/05/2024
t'as vérifié que les labels des nodes correspondent bien à ce que cherche ton pod ?
Membre depuis le 03/06/2024
la `toleration` permet au pod d'être accepté sur le node, mais elle ne l'oblige pas à y aller. k8s peut quand même essayer de le mettre ailleurs. ajoute un `nodeselector` ou une `nodeaffinity` pour forcer le scheduler à choisir spécifiquement ces nodes gpu
Membre depuis le 20/07/2020
exact, avec le nodeSelector en plus de la toleration, ils popent au bon endroit. merci !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
laroche-luc
Membre depuis le 20/07/2020
slt, je viens d'ajouter des nodes avec des GPU sur mon cluster. j'ai mis une taint pour que seuls mes jobs de ML aillent dessus, mais mes pods de ML restent en Pending alors que j'ai mis la toleration