latence de résolution dns en interne sur k8s

Posté par costa-jacqueline le 11/07/2025
RÉSOLU

costa-jacqueline

Membre depuis le 16/11/2024

yo les experts j'ai un problème de ouf sur mon cluster k8s les résolutions dns sont méga lentes pour des services internes genre un pod qui essaye de joindre service-a.namespace.svc.cluster.local ça prend genre 500ms des fois c'est n'importe quoi. CoreDNS est là mais ça rame. Y'a des centaines de requêtes par seconde mais quand même

# Exemple de dig
dig service-a.namespace.svc.cluster.local

; <<>> DiG 9.11.5-P4 <<>> service-a.namespace.svc.cluster.local
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 32669
;; flags: qr rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 0

;; QUESTION SECTION:
;service-a.namespace.svc.cluster.local. IN A

;; ANSWER SECTION:
service-a.namespace.svc.cluster.local. 30 IN A 10.42.0.10

;; Query time: 487 msec
;; SERVER: 10.96.0.10#53(10.96.0.10)
;; WHEN: Mon Jan 01 00:00:00 UTC 2024
;; MSG SIZE  rcvd: 78

Commentaires

plebon

Membre depuis le 29/01/2025

salut t'as check les logs de CoreDNS ? des fois il y a des erreurs de plugins ou de cache. et quelle est la taille de ton cluster ? beaucoup de services ? ptete CoreDNS est juste sous-provisionné en CPU/RAM

costa-jacqueline

Membre depuis le 16/11/2024

les logs CoreDNS sont cleans pas d'erreurs bizarres. le cluster est moyen genre 50 nodes 200 services. c'est vrai que les pods CoreDNS sont en default config je vais essayer de leur mettre plus de ressources. ils tournent sur quel scheduler ? default ou des trucs spécifiques ?

plebon

Membre depuis le 29/01/2025

default scheduler. mais tu peux aussi regarder les conntrack tables des nodes. si y'a trop de connexions ça peut ralentir le kernel à traiter les paquets DNS. des fois une purge des conntrack entries peut aider si c'est la cata mais c'est temporaire. faut trouver la source des trop nombreuses connexions. et aussi un truc con mais le DNS est activé au niveau du kernel de tes workers pour les pods ?

costa-jacqueline

Membre depuis le 16/11/2024

ouais conntrack c'est une piste. je vais monitorer ça. pour CoreDNS j'ai mis plus de CPU et RAM et ça a l'air de mieux aller j'ai moins de spikes à 500ms. ça reste pas parfait mais c'est mieux. thx pour les idées

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire