8 commentaires
ça sent le souci de health checks flapping ou de cache dns. tes services lents ils ont des health checks instables ? quand un check flap consul doit constamment mettre à jour son catalogue et ça peut ralentir les résolutions
t'as un client DNS en cache local (genre dnsmasq ou systemd-resolved) sur tes machines qui font les requêtes ? des fois ça interagit mal avec consul. le mieux c de faire pointer resolv.conf sur l'agent consul local pour le domaine .consul
j'ajouterais un point sur les requêtes de services pas enregistrés. si tu as beaucoup de requêtes pour des services qui n'existent pas consul doit les forwarder ce qui peut aussi ajouter de la latence. regarde les logs de ton agent consul pour les requêtes non résolues
check aussi les performances du stockage de tes serveurs consul. si le disque est lent pour écrire les infos de catalogue ça impacte tout
bon j'ai creusé c'était un mix de plusieurs trucs. systemd-resolved qui faisait des siennes avec le port 8600 et des health checks de mes services qui étaient trop sensibles et flappaient souvent. j'ai configuré systemd-resolved pour forwarder juste .consul au local agent et j'ai ajusté la config des health checks. la latence est revenue à la normale. merci les gars pour toutes les pistes !
Laisser une réponse
Vous devez être connecté pour poster un message !
hello la team ! on a un souci de latence avec la résolution DNS de consul. sur certains services (pas tous bizarrement) la résolution prend entre 200 et 300ms ce qui est inacceptable pour nos microservices. les agents consul sont bien up le ping est ok entre tout le monde. une idée d'où ça peut venir ?