DNS résolution lente sur EKS avec CoreDNS

Posté par jean-bigot le 05/03/2025
RÉSOLU

jean-bigot

Membre depuis le 19/05/2024

yo la team j'ai un souci bizarre sur notre cluster EKS. les résolutions DNS sont hyper lentes genre 500ms des fois alors que ça devrait être quasi instantané. on utilise CoreDNS par défaut. j'ai checké les logs des pods CoreDNS et pas d'erreurs flagrantes, juste que ça prend du temps. une idée d'où ça peut venir ?

kubectl logs -n kube-system -l k8s-app=kube-dns

Commentaires

louis-albert

Membre depuis le 15/06/2024

hello t'as regardé les métriques cpu/mémoire de tes pods coredns ? des fois ils sont throttlés si les limites sont trop basses et ça ralentit tout. ou si t'as un gros traffic dns, coredns est ptete sous-dimensionné en réplicas ou en ressources

durand-lucas

Membre depuis le 19/02/2025

et t'es sûr que ton VPC DNS resolver est pas surchargé ? les requêtes qui ne sont pas résolues par CoreDNS (genre les externes) partent vers le resolver du VPC. chaque subnet a une limite. regarde si t'as des `SERVFAIL` ou des `NXDOMAIN` dans les logs CoreDNS

jean-bigot

Membre depuis le 19/05/2024

les pods CoreDNS sont ok niveau ressources. j'ai mis plus de réplicas pour voir mais ça change pas grand chose. pour le VPC resolver j'ai pas pensé à ça, comment je peux monitorer ça ?

rrenaud

Membre depuis le 14/02/2025

le VPC resolver c'est galère à monitorer direct. mais si t'as un service mesh genre istio ou linkerd qui interceptent le DNS ça peut être une piste aussi. sinon, et c'est con, mais t'as un MTU de 1500 sur tes interfaces ? si t'as des jumbo frames (9001) et qu'un équipement au milieu le fragmente, ça peut impacter les réponses DNS surtout en UDP

jean-bigot

Membre depuis le 19/05/2024

pas de service mesh. le MTU... c'est une excellente piste. on a des appliances au milieu qui pourraient avoir un MTU plus petit. je vais tester de forcer le MTU à 1500 sur une instance de test et voir si ça améliore

louis-albert

Membre depuis le 15/06/2024

bien vu le MTU c'est un piège classique. utilise `ping -M do -s 1472 ` depuis ton pod pour voir si les paquets de 1500 passent sans fragmentation

jean-bigot

Membre depuis le 19/05/2024

OMG c'était bien ça ! Le MTU était à 9001 sur les EKS nodes et notre firewall au milieu le réduisait sans le dire. Forcer 1500 sur les interfaces a réglé le problème de latence DNS. Vous êtes des chefs, thx !

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire