Sujet :

Prometheus : Alerte qui s'auto-mute après quelques secondes

RÉSOLU

Liste des sujets Répondre Créer un sujet

plombard

Membre depuis le 08/07/2024

salut tout le monde, j'ai un truc chelou avec mes alertes prometheus. elles se déclenchent bien dans alertmanager, je vois la notif slack, et 10 secondes après elles passent en résolues alors que la condition de l'alerte est toujours vraie. c'est quoi ce bordel ? mon scrape interval est de 15s et l'eval interval de 15s aussi

marion-noel

Membre depuis le 04/03/2025

hmm ça sent le for clause trop court dans ta règle d'alerte. si t'as for: 10s et que prometheus ne voit pas la condition vraie pendant au moins 10s consécutives ça va pas fonctionner si t'as des micro-absences de métrique ou des fluctuations. essaye de mettre for: 1m pour voir si ça tient

helene-meunier

Membre depuis le 27/09/2024

ou alors ton exporter il envoie des données stale ou alors c'est un counter qui est reset trop vite ce qui fait que la valeur moyenne calculée sur la période tombe. regarde bien l'historique de la métrique dans prometheus UI

plombard

Membre depuis le 08/07/2024

c'était bien la clause for ! j'avais mis 10s et avec les fluctuations du réseau la métrique passait en no_data quelques ms et ça coupait l'alerte. je suis passé à 30s et ça marche nickel. merci les gars !

Répondre

vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire