3 commentaires
augmente ton scrape_timeout dans ta config prometheus par défaut c'est souvent trop court si ton app met du temps à générer les métriques
scrape_timeout: 30s
vérifie aussi si t'as pas des network policies qui drop le traffic venant du namespace de prometheus ou si t'as pas un souci de mtu sur ton cni
c'était bien le timeout j'ai passé à 15s au lieu de 5s et plus de soucis de targets down merci
Laisser une réponse
Vous devez être connecté pour poster un message !
mes targets tombent en timeout les unes après les autres sur mon cluster k8s alors que les pods sont bien en vie et répondent au curl