etcd cluster lent et des elections leader a repet

penelope-aubry 19/09/2025
RÉSOLU
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

yo la team j'ai un souci avec un cluster k8s les apis sont super lentes et je vois des messages d'elections leader dans les logs etcd. l'infra c'est du vmware on-prem pas de cloud. on a trois noeuds etcd chacun sur sa propre vm avec du storage local.

journalctl -u etcd -f | grep 'leader changed'

ça spamme des fois c relou le cluster a genre 50k keys. des idees pour debug ?

19/09/2025 à 19:22

16 commentaires

omercier
Membre Actif Secouriste
Avatar de omercier
omercier
Membre Actif Secouriste

salut t'as check les metriques iops sur les disques ou etcd tourne souvent c'est le storage le bottleneck. et la latence reseau entre tes noeuds etcd ? ca doit etre <1ms

20/09/2025 à 15:00
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

les disques sont censés être rapides du nvme local. iops ok pour l'instant. latence réseau j'ai fait des pings inter-noeuds c'est genre 0.2ms. on a 10g entre eux.

21/09/2025 à 14:33
lejeune-francois
Membre Actif
Avatar de lejeune-francois
lejeune-francois
Membre Actif

regarde aussi la compaction etcd. si elle ne suit pas les evenements l'espace disque peut gonfler et ralentir tout. t'as une retention setup ?

etcdctl member list --write-out=table
etcdctl endpoint status --write-out=table
22/09/2025 à 13:05
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

oui la compaction est activee par default avec la retention sur 30min mais j'ai pas verifié si ca tournait bien. l'espace disque est ok pour l'instant pas de saturation.

23/09/2025 à 10:11
omercier
Membre Actif Secouriste
Avatar de omercier
omercier
Membre Actif Secouriste

check les 'AppliedIndex' et 'CommittedIndex' via les metriques prometheus de etcd. si y'a un gros ecart ca indique un lag. et les 'leader_changes_total' bien sur. tu peux aussi augmenter le --election-timeout si ton reseau est juste un peu flou

24/09/2025 à 08:23
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

j'ai bien les metriques. le AppliedIndex est parfois un peu derriere le CommittedIndex sur les followers c'est vrai. leader_changes_total est monté en fleche ces derniers jours.

25/09/2025 à 04:04
lejeune-francois
Membre Actif
Avatar de lejeune-francois
lejeune-francois
Membre Actif

tu utilises des snapshots auto ? et quel est ton quorum size ? si t'as 3 noeuds c'est 2 le quorum. assure toi que tous les noeuds soient au courant de tous les autres pour le vote

26/09/2025 à 01:11
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

snapshots oui mais pas de probleme de place. quorum size par defaut 2 sur 3. je pense que tous les noeuds se connaissent bien la config est bonne.

27/09/2025 à 00:11
omercier
Membre Actif Secouriste
Avatar de omercier
omercier
Membre Actif Secouriste

une autre idee. les ressources CPU / RAM des VMs etcd sont suffisantes ? et tu as bien desactivé le swap dessus ? etdd est sensible a ca.

27/09/2025 à 19:05
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

CPU/RAM c'est du lourd 8c/32g. swap est bien off partout. je penche pour un truc plus subtil. est-ce que le traffic net entre apiserver et etcd est propre ?

28/09/2025 à 14:30
lejeune-francois
Membre Actif
Avatar de lejeune-francois
lejeune-francois
Membre Actif

ouais ca peut etre ca un truc qui sature le reseau sur tes apiservers quand ils parlent a etcd. regarde tcpdump sur etcd pour voir le traffic entrant pendant ces phases de lag. combien de connexions ?

29/09/2025 à 09:31
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

ok je vais faire un tcpdump sur le port 2379 pour voir. je soupconne que les apiservers spamment etcd quand y'a beaucoup de deploiements ou de resyncs de controllers.

30/09/2025 à 06:48
omercier
Membre Actif Secouriste
Avatar de omercier
omercier
Membre Actif Secouriste

si c'est le cas etcd a du mal a repondre aux requetes du leader et les followers le declarent mort. tu peux tester de limiter les requetes apiserver vers etcd pour voir si ca calme le jeu temporairement.

01/10/2025 à 05:00
lejeune-francois
Membre Actif
Avatar de lejeune-francois
lejeune-francois
Membre Actif

et n'oublie pas le etcdctl defrag en cas de gros volume de keys et de delete. ca peut aider a liberer de l'espace dans la bdd etcd

Modifié le 23/05/2026 à 16:20
penelope-aubry
Auteur Actif
Avatar de penelope-aubry
penelope-aubry
Auteur Actif

d'acc je vais mettre en place des limites sur les apiservers pour etcd et faire un defrag apres les heures de pointe. merci les gars je vous tiens au jus.

02/10/2025 à 21:55
omercier
Membre Actif Secouriste
Avatar de omercier
omercier
Membre Actif Secouriste

bon courage tiens nous informés du resultat !

03/10/2025 à 16:20

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire