etcd leader election instable sur k8s clusters galère

poirier-david 10/04/2025
RÉSOLU
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

salut la team on a un gros souci sur un de nos clusters k8s l'api server fait des freez aléatoires les logs etcd montrent des leader election timeouts de ouf on a trois noeuds masters ils ont de la ressource pourtant

---apiVersion: apps/v1kind: Deploymentmetadata:  name: etcd-exporter  namespace: kube-systemspec:  replicas: 1  selector:    matchLabels:      app: etcd-exporter  template:    metadata:      labels:        app: etcd-exporter    spec:      containers:      - name: etcd-exporter        image: quay.io/prometheuscommunity/etcd-exporter:v0.12.0        args:        - --etcd.server=https://127.0.0.1:2379        - --etcd.cert=/etc/kubernetes/pki/apiserver-etcd-client.crt        - --etcd.key=/etc/kubernetes/pki/apiserver-etcd-client.key        - --etcd.ca=/etc/kubernetes/pki/etcd/ca.crt        ports:        - name: metrics          containerPort: 9978          protocol: TCP
10/04/2025 à 04:32

19 commentaires

martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

check les logs systemd d'etcd sur chaque master t'as des warnings genre "apply request took too long"

10/04/2025 à 22:34
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

ouais pas mal de "apply request took too long" et des "wal fsync took too long" même

11/04/2025 à 16:46
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

ah ok alors c'est l'infra disk derrière etcd qui est pas assez perf c'est du ssd ou hdd

12/04/2025 à 11:09
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

c'est du ssd provisionné sur notre env vmware mais j'avoue que le storage est partagé avec d'autres trucs

13/04/2025 à 07:13
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

mauvaise idée etcd est ultra sensible à la latence disque il lui faut son propre iops si possible dédiés sinon ça part en vrille direct

14/04/2025 à 03:20
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

t'as regardé les métriques disque iops et latence depuis les noeuds masters direct ? genre iotop ou iostat

14/04/2025 à 22:27
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

iostat me sort des avgrq-sz énormes et des await à genre 50-100ms sur le volume etcd

15/04/2025 à 19:22
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

voilà tu as ta cause 50ms d'await c'est la mort pour etcd faudrait être sous 10ms voir 5ms max. le problème est clairement côté storage

16/04/2025 à 18:14
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

est-ce que ton WAL dir est séparé de ta data dir ? c'est une best practice pour etcd si tu peux le faire

17/04/2025 à 17:48
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

non tout est sur le même volume par défaut j'avais pas pensé à ça

18/04/2025 à 15:11
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

faut absolument séparer le WAL dir sur un volume avec des iops encore plus rapides s'il y a un moyen

19/04/2025 à 09:21
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

ok je vais voir avec l'équipe infra si on peut monter un nouveau volume ultra rapide juste pour le WAL et resizer le volume data

20/04/2025 à 03:31
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

fais gaffe la migration du WAL dir c'est un peu tricky faut arrêter etcd faire le move et relancer

20/04/2025 à 21:39
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

je suis en train de faire ça. stop etcd déplacer reconfigurer le service et relancer

21/04/2025 à 16:13
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

n'oublie pas de backup avant hein tu connais la musique

22/04/2025 à 11:36
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

oui oui j'ai un snapshot vmware en cas de pépin thx. je relance et je te dis

23/04/2025 à 09:21
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

bon on dirait que c'est le jour et la nuit les leader elections sont stables plus de timeouts les awaits sont descendus à 2-3ms sur le WAL dir dédié c'est super fluide

24/04/2025 à 07:47
martins-margot
Membre Actif Secouriste
Avatar de martins-margot
martins-margot
Membre Actif Secouriste

nickel on avait eu le même souci sur un gros cluster chez nous une fois c'est un grand classique pour etcd le storage

25/04/2025 à 05:39
poirier-david
Auteur Actif
Avatar de poirier-david
poirier-david
Auteur Actif

grave merci bcp pour l'aide je pensais pas que ça aurait autant d'impact

26/04/2025 à 02:33

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire
An Error Occurred: Internal Server Error

Oops! An Error Occurred

The server returned a "500 Internal Server Error".

Something is broken. Please let us know what you were doing when this error occurred. We will fix it as soon as possible. Sorry for any inconvenience caused.