Membre depuis le 15/06/2024
hello t'as regardé les métriques cpu/mémoire de tes pods coredns ? des fois ils sont throttlés si les limites sont trop basses et ça ralentit tout. ou si t'as un gros traffic dns, coredns est ptete sous-dimensionné en réplicas ou en ressources
Membre depuis le 19/02/2025
et t'es sûr que ton VPC DNS resolver est pas surchargé ? les requêtes qui ne sont pas résolues par CoreDNS (genre les externes) partent vers le resolver du VPC. chaque subnet a une limite. regarde si t'as des `SERVFAIL` ou des `NXDOMAIN` dans les logs CoreDNS
Membre depuis le 11/06/2019
les pods CoreDNS sont ok niveau ressources. j'ai mis plus de réplicas pour voir mais ça change pas grand chose. pour le VPC resolver j'ai pas pensé à ça, comment je peux monitorer ça ?
Membre depuis le 04/03/2019
le VPC resolver c'est galère à monitorer direct. mais si t'as un service mesh genre istio ou linkerd qui interceptent le DNS ça peut être une piste aussi. sinon, et c'est con, mais t'as un MTU de 1500 sur tes interfaces ? si t'as des jumbo frames (9001) et qu'un équipement au milieu le fragmente, ça peut impacter les réponses DNS surtout en UDP
Membre depuis le 11/06/2019
pas de service mesh. le MTU... c'est une excellente piste. on a des appliances au milieu qui pourraient avoir un MTU plus petit. je vais tester de forcer le MTU à 1500 sur une instance de test et voir si ça améliore
Membre depuis le 15/06/2024
bien vu le MTU c'est un piège classique. utilise `ping -M do -s 1472
Membre depuis le 11/06/2019
OMG c'était bien ça ! Le MTU était à 9001 sur les EKS nodes et notre firewall au milieu le réduisait sans le dire. Forcer 1500 sur les interfaces a réglé le problème de latence DNS. Vous êtes des chefs, thx !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
jean-bigot
Membre depuis le 11/06/2019
yo la team j'ai un souci bizarre sur notre cluster EKS. les résolutions DNS sont hyper lentes genre 500ms des fois alors que ça devrait être quasi instantané. on utilise CoreDNS par défaut. j'ai checké les logs des pods CoreDNS et pas d'erreurs flagrantes, juste que ça prend du temps. une idée d'où ça peut venir ?