Membre depuis le 16/11/2024
yo les experts j'ai un problème de ouf sur mon cluster k8s les résolutions dns sont méga lentes pour des services internes genre un pod qui essaye de joindre service-a.namespace.svc.cluster.local ça prend genre 500ms des fois c'est n'importe quoi. CoreDNS est là mais ça rame. Y'a des centaines de requêtes par seconde mais quand même
# Exemple de dig
dig service-a.namespace.svc.cluster.local
; <<>> DiG 9.11.5-P4 <<>> service-a.namespace.svc.cluster.local
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 32669
;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0
;; QUESTION SECTION:
;service-a.namespace.svc.cluster.local. IN A
;; ANSWER SECTION:
service-a.namespace.svc.cluster.local. 30 IN A 10.42.0.10
;; Query time: 487 msec
;; SERVER: 10.96.0.10#53(10.96.0.10)
;; WHEN: Mon Jan 01 00:00:00 UTC 2024
;; MSG SIZE rcvd: 78
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
Commentaires
plebon
Membre depuis le 29/01/2025
salut t'as check les logs de CoreDNS ? des fois il y a des erreurs de plugins ou de cache. et quelle est la taille de ton cluster ? beaucoup de services ? ptete CoreDNS est juste sous-provisionné en CPU/RAM
costa-jacqueline
Membre depuis le 16/11/2024
les logs CoreDNS sont cleans pas d'erreurs bizarres. le cluster est moyen genre 50 nodes 200 services. c'est vrai que les pods CoreDNS sont en default config je vais essayer de leur mettre plus de ressources. ils tournent sur quel scheduler ? default ou des trucs spécifiques ?
plebon
Membre depuis le 29/01/2025
default scheduler. mais tu peux aussi regarder les conntrack tables des nodes. si y'a trop de connexions ça peut ralentir le kernel à traiter les paquets DNS. des fois une purge des conntrack entries peut aider si c'est la cata mais c'est temporaire. faut trouver la source des trop nombreuses connexions. et aussi un truc con mais le DNS est activé au niveau du kernel de tes workers pour les pods ?
costa-jacqueline
Membre depuis le 16/11/2024
ouais conntrack c'est une piste. je vais monitorer ça. pour CoreDNS j'ai mis plus de CPU et RAM et ça a l'air de mieux aller j'ai moins de spikes à 500ms. ça reste pas parfait mais c'est mieux. thx pour les idées