résolution dns lente sur k8s cluster

frederique-cousin 27/10/2025
RÉSOLU

yo la team ! on a des soucis de perfs de fou au démarrage de nos pods dans k8s. les logs montrent que les résolutions dns prennent parfois genre 5-10s au lieu de qques ms. ca plombe grave le scaling. on est sur coredns par défaut et ca touche les lookups internes et externes. une idée d'où ça peut venir ?

kubectl logs -n kube-system -l k8s-app=kube-dns
# souvent des timeout ou des réponses lentes
27/10/2025 à 04:34

8 commentaires

sdesousa
Membre Actif Secouriste
Avatar de sdesousa
sdesousa
Membre Actif Secouriste

salut. t'as checké les métriques de coredns ? genre les requêtes par sec son cpu mem. des fois c juste le pod qui est sous-dimensionné et il rame. aussi regarde les logs de coredns il peut y avoir des erreurs de forward vers l'upstream dns

28/10/2025 à 04:27
andre15
Membre Actif
Avatar de andre15
andre15
Membre Actif

ouais et coredns en général c'est pas le top pour la latence. avez-vous envisagé le node local dns cache ? ca met un cache dns sur chaque noeud et ca réduit la charge sur coredns et la latence pour les pods

29/10/2025 à 00:54
sdesousa
Membre Actif Secouriste
Avatar de sdesousa
sdesousa
Membre Actif Secouriste

c clair node local dns cache aide bien. sinon t'as des network policies qui pourraient bloquer le trafic udp 53 entre les pods et coredns ? ca arrive souvent

29/10/2025 à 22:32

les métriques coredns sont ok cpu mem ca bouge pas bcp. pas de netpol qui bloque udp 53. le node local dns cache j'y ai pensé mais c'est pas encore implémenté. les logs coredns montrent des requêtes ok mais des fois elles mettent juste du temps à être forwardées

30/10/2025 à 16:47
andre15
Membre Actif
Avatar de andre15
andre15
Membre Actif

ok si c'est pas coredns lui-même qui rame, c'est l'upstream dns. vers où coredns forwarde les requêtes non-cluster ? si c'est un dns interne à votre infra on-prem ou un vpn ça peut être saturé ou juste lent

31/10/2025 à 11:58
sdesousa
Membre Actif Secouriste
Avatar de sdesousa
sdesousa
Membre Actif Secouriste

c'est ça souvent. si c'est un dns interne, testez de configurer coredns pour utiliser 1.1.1.1 ou 8.8.8.8 pour les requêtes externes et votre dns interne juste pour vos zones privées. ca soulage énormément

01/11/2025 à 09:29

ah putain oui c'est ca. on forwarde tout vers notre dns interne pourri pour tout ce qui est pas zone cluster. c'est lui qui est overloaddd. on va spliter ca

02/11/2025 à 07:23

c'était bien ça ! j'ai configuré coredns avec un mix d'upstream, public pour l'externe et notre dns interne juste pour nos zones spécifiques. la latence a disparu et les pods démarrent en un clin d'oeil. merci la team !!!

03/11/2025 à 02:35

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire