3 commentaires
c est souvent la latence disque qui tue le quorum etcd regarde les iowait sur tes nodes masters
si tes disques sont trop lents augmente les timeouts de heartbeat
tu peux tester les perfs de tes disques avec fio pour voir si tu tiens les 50 iops minimum demandés par etcd pour le wal
fio --name=etcd-test --rw=write --ioengine=libaio --bs=4k --fdatasync=1 --size=2G
mes disques ssd etaient satures par un backup qui tournait en meme temps
j ai stoppé le backup et le leader election a reussi tout de suite merci
Laisser une réponse
Vous devez être connecté pour poster un message !
mon cluster k8s est completement planté j ai des erreurs etcd has no leader dans les logs d api server
j ai trois nodes master et ils arrivent plus a se mettre d accord