c est souvent la latence disque qui tue le quorum etcd regarde les iowait sur tes nodes masters
si tes disques sont trop lents augmente les timeouts de heartbeat
tu peux tester les perfs de tes disques avec fio pour voir si tu tiens les 50 iops minimum demandés par etcd pour le wal
fio --name=etcd-test --rw=write --ioengine=libaio --bs=4k --fdatasync=1 --size=2G
mes disques ssd etaient satures par un backup qui tournait en meme temps
j ai stoppé le backup et le leader election a reussi tout de suite merci
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
stephane-rousset
Membre depuis le 03/02/2025mon cluster k8s est completement planté j ai des erreurs etcd has no leader dans les logs d api server
j ai trois nodes master et ils arrivent plus a se mettre d accord