Résolution DNS interne qui flanche après une mise à jour K8s

Question

yo la team ! après une update de notre cluster k8s (kube-apiserver, kube-controller-manager, etc.) la résolution dns interne est devenue super instable. genre la moitié des services arrivent plus à pinger d'autres services par leur nom. les logs de coredns sont cleans mais j'ai des host not found partout

# Exemple d'erreur dans les logs d'un pod applicatif
kubectl logs my-app-pod-xyz
Error: lookup service-b.mynamespace.svc.cluster.local on 10.96.0.10:53: no such host

colette-jacquet · Answer

hello. t'as checké la configmap de coredns ? des fois une update peut écraser des customisations genre des stubDomains ou des serveurs upstream spécifiques. compare avec ton ancienne version

apetitjean · Answer

ouaip j'ai déjà checké la configmap rien de neuf. elle est identique à avant l'update. mais c'est bizarre certains pods ont le problème d'autres non dans le même namespace. c'est aléatoire.

ldelmas · Answer

hum aléatoire ça pue. t'aurais pas mis en place de nouvelles network policies par hasard ? une politique trop restrictive pourrait bloquer le trafic udp/tcp 53 vers le service coredns pour certains pods

apetitjean · Answer

ah merde c'est une bonne piste ! on a déployé un nouveau jeu de network policies il y a deux jours en même temps que l'update k8s. je vais regarder ça de près pour voir si ça bloque pas le namespace kube-system ou l'accès aux services dns

colette-jacquet · Answer

et aussi un truc con mais le nombre de réplicas de coredns ? si t'en as pas assez ou que certains sont sur des nœuds saturés ça peut créer des latences ou des timeouts pour la résolution surtout si t'as beaucoup de requêtes

apetitjean · Answer

vous êtes des génies ! c'était bien une network policy qui bloquait les egress vers le clusterIP de coredns pour les namespaces critiques. un oubli dans les règles. j'ai corrigé et tout est rentré dans l'ordre direct. merci beaucoup pour l'aide

Résolution DNS interne qui flanche après une mise à jour K8s

6 commentaires

Laisser une réponse

Les conditions dans le langage de programmation Go

Introduction au cours complet sur Terraform

Environnements et Déploiements GitLab pour la Mise en Production

Bio-Inspired DevOps : Quand l'Infrastructure Respire et Évolue

Sécurisez vos secrets Kubernetes en 5 minutes chrono

Rejoindre la communauté