résolution dns lente sur k8s cluster

Question

yo la team ! on a des soucis de perfs de fou au démarrage de nos pods dans k8s. les logs montrent que les résolutions dns prennent parfois genre 5-10s au lieu de qques ms. ca plombe grave le scaling. on est sur coredns par défaut et ca touche les lookups internes et externes. une idée d'où ça peut venir ?
kubectl logs -n kube-system -l k8s-app=kube-dns
# souvent des timeout ou des réponses lentes

sdesousa · Answer

salut. t'as checké les métriques de coredns ? genre les requêtes par sec son cpu mem. des fois c juste le pod qui est sous-dimensionné et il rame. aussi regarde les logs de coredns il peut y avoir des erreurs de forward vers l'upstream dns

andre15 · Answer

ouais et coredns en général c'est pas le top pour la latence. avez-vous envisagé le node local dns cache ? ca met un cache dns sur chaque noeud et ca réduit la charge sur coredns et la latence pour les pods

sdesousa · Answer

c clair node local dns cache aide bien. sinon t'as des network policies qui pourraient bloquer le trafic udp 53 entre les pods et coredns ? ca arrive souvent

frederique-cousin · Answer

les métriques coredns sont ok cpu mem ca bouge pas bcp. pas de netpol qui bloque udp 53. le node local dns cache j'y ai pensé mais c'est pas encore implémenté. les logs coredns montrent des requêtes ok mais des fois elles mettent juste du temps à être forwardées

andre15 · Answer

ok si c'est pas coredns lui-même qui rame, c'est l'upstream dns. vers où coredns forwarde les requêtes non-cluster ? si c'est un dns interne à votre infra on-prem ou un vpn ça peut être saturé ou juste lent

sdesousa · Answer

c'est ça souvent. si c'est un dns interne, testez de configurer coredns pour utiliser 1.1.1.1 ou 8.8.8.8 pour les requêtes externes et votre dns interne juste pour vos zones privées. ca soulage énormément

frederique-cousin · Answer

ah putain oui c'est ca. on forwarde tout vers notre dns interne pourri pour tout ce qui est pas zone cluster. c'est lui qui est overloaddd. on va spliter ca

frederique-cousin · Answer

c'était bien ça ! j'ai configuré coredns avec un mix d'upstream, public pour l'externe et notre dns interne juste pour nos zones spécifiques. la latence a disparu et les pods démarrent en un clin d'oeil. merci la team !!!

résolution dns lente sur k8s cluster

8 commentaires

Laisser une réponse

Les tableaux dans le langage de programmation Go

Comprendre et utiliser Filebeat dans la stack ELK

Comprendre et utiliser Metricbeat dans la stack ELK

Hugepages : L'optimisation mémoire cachée des systèmes haute performance

Optimisez vos images Docker : La méthode multi-stage

Rejoindre la communauté