4 commentaires
les logs CoreDNS sont cleans pas d'erreurs bizarres. le cluster est moyen genre 50 nodes 200 services. c'est vrai que les pods CoreDNS sont en default config je vais essayer de leur mettre plus de ressources. ils tournent sur quel scheduler ? default ou des trucs spécifiques ?
default scheduler. mais tu peux aussi regarder les conntrack tables des nodes. si y'a trop de connexions ça peut ralentir le kernel à traiter les paquets DNS. des fois une purge des conntrack entries peut aider si c'est la cata mais c'est temporaire. faut trouver la source des trop nombreuses connexions. et aussi un truc con mais le DNS est activé au niveau du kernel de tes workers pour les pods ?
ouais conntrack c'est une piste. je vais monitorer ça. pour CoreDNS j'ai mis plus de CPU et RAM et ça a l'air de mieux aller j'ai moins de spikes à 500ms. ça reste pas parfait mais c'est mieux. thx pour les idées
Laisser une réponse
Vous devez être connecté pour poster un message !
yo les experts j'ai un problème de ouf sur mon cluster k8s les résolutions dns sont méga lentes pour des services internes genre un pod qui essaye de joindre service-a.namespace.svc.cluster.local ça prend genre 500ms des fois c'est n'importe quoi. CoreDNS est là mais ça rame. Y'a des centaines de requêtes par seconde mais quand même