etcd leader election flapping k8s prod

hebert-camille 11/06/2025
RÉSOLU
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

yo la team on a un gros souci en prod sur notre cluster k8s l'api server est ultra lent et on voit des evictions aléatoires. les logs etcd montrent des leader elections à la chaine. la config par défaut semble plus tenir la charge. on est sur trois nœuds masters dedicated avec ssd NVMe pourtant

kind: EtcdCluster
apiVersion: etcd.database.coreos.com/v1alpha1
metadata:
  name: my-etcd-cluster
spec:
  size: 3
  version: 3.5.0
  clientPort: 2379
  peerPort: 2380
  storage:
    volumeClaimTemplate:
      spec:
        accessModes: ["ReadWriteOnce"]
        resources:
          requests:
            storage: 100Gi
11/06/2025 à 09:34

16 commentaires

colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

hello ! le flapping c'est souvent un souci de latence réseau ou de perf disque. tes métriques montrent quoi pour l'iops ou le network latency entre tes masters ?

12/06/2025 à 06:56
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

les métriques sont ok pour l'iops et le network entre nodes. pas de spike. j'ai l'impression que c plus lié au volume d'écritures

13/06/2025 à 03:29
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

check tes logs etcd pour des warnings sur le fsync. si tes disques sont pas assez rapides pour fsync c'est la cata. ou ptete le wal size

13/06/2025 à 23:56
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

j'ai ça dans les logs :

raft: leader election timed out
le wal est sur 128MB par défaut

14/06/2025 à 18:02
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

ouais election timeout c'est classique. augmente le election timeout dans la config etcd ptete à 1000ms au lieu de 500ms si t'as de la latence inter-nœuds qui varie un peu

15/06/2025 à 12:27
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

d'acc je vais essayer ça. et pour le wal j'augmente aussi ? genre 512MB ou 1GB

16/06/2025 à 09:56
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

pour le wal tu peux monter oui genre à 256 ou 512. mais surtout regarde le --heartbeat-interval et --election-timeout. le heartbeat doit être genre 5x plus petit que l'election timeout

17/06/2025 à 07:06
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

j'ai mis election à 1000ms et heartbeat à 100ms. ça a l'air un peu plus stable mais j'ai toujours quelques flaps par ci par là sur les heures de pointe

18/06/2025 à 04:22
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

ok si ça continue après ces réglages c'est ptete un souci de filesystem xfs vs ext4 ou des options de mount. t'es sur quel fs pour le volume etcd

19/06/2025 à 03:16
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

ext4 par défaut. les options de mount c'est juste defaults

20/06/2025 à 02:44
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

essaie avec noatime,data=writeback si c'est pour du ssd. ça peut améliorer drastiquement les perf disque pour etcd. xfs est souvent préféré aussi pour etcd mais bon ext4 avec de bonnes options ça passe

21/06/2025 à 01:00
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

ok je vais tenter le remount avec ces options. faut que je redéploie le pv/pvc pour ça je crois

21/06/2025 à 22:15
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

oui ou une maintenance sur tes masters. et check aussi ton coredns s'il est pas en PLS ça peut impacter la découverte des peers etcd

22/06/2025 à 17:26
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

j'ai refait les volumes avec noatime,data=writeback c'est le jour et la nuit. plus aucun flap depuis une heure et l'api server répond au quart de tour. merci c'était le disque finalement

23/06/2025 à 16:56
colette62
Membre Actif Secouriste
Avatar de colette62
colette62
Membre Actif Secouriste

nickel ! les options de mount c'est souvent un truc oublié mais super important pour les bases de données distribuées comme etcd

24/06/2025 à 12:57
hebert-camille
Auteur Actif
Avatar de hebert-camille
hebert-camille
Auteur Actif

clairement un truc à retenir. thx pour l'aide ça a sauvé ma semaine

25/06/2025 à 11:39

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire