vault ha avec raft sur un cluster k8s les pods redémarrent en boucle

Posté par imbert-anne le 24/04/2025
RÉSOLU

imbert-anne

Membre depuis le 04/06/2024

hello la team on essaie de déployer vault en mode ha avec raft comme storage backend sur k8s. ça tourne jamais. les pods vault redémarrent en boucle avec des logs qui parlent de "failed to init raft storage" ou "raft snapshot error". c'est super frustrant on a suivi la doc officielle mais ça part pas. le pv est un nfs partagé entre les replicas. qqn a déjà eu ça ?

Commentaires

duval-pierre

Membre depuis le 19/11/2024

salut. le nfs c'est pas le top pour raft. raft a besoin de latence ultra basse et de consistance forte sur les writes. nfs c'est souvent la source de problèmes. tu as bien configuré les permissions sur le mountpoint nfs pour l'user id de vault ?

cbarbe

Membre depuis le 18/10/2024

en plus de nfs et des permissions, raft est très sensible à la clock drift. assure-toi que tous tes nodes k8s sont bien synchronisés via ntp. même quelques secondes de décalage peuvent foutre le bordel dans le consensus

duval-pierre

Membre depuis le 19/11/2024

ouais et aussi check les ressources cpu/mem de tes pods vault. si ils sont trop contraints ils peuvent pas traiter les opérations raft assez vite et ça provoque des timeout et des redémarrages. augmente un peu les limites pour voir

imbert-anne

Membre depuis le 04/06/2024

ok je vais vérifier les permissions nfs et la synchro ntp des nodes. pour les ressources j'avais déjà mis un peu plus mais j'vais essayer d'augmenter encore. le nfs on n'a pas trop le choix pour l'instant. merci pour les infos

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire