Prometheus : alertes 'cible down' trop sensibles

Posté par mlegros le 30/12/2025
RÉSOLU

mlegros

Membre depuis le 20/05/2020

yo l'équipe on a prometheus qui nous spam d'alertes target down pour des cibles qui disparaissent et reviennent en 30 secondes. on veut pas être alerté si c'est juste un redémarrage ou un déploiement rapide. comment on gère ça proprement ?


# règle actuelle
- alert: TargetDown
  expr: up == 0
  for: 0s
  labels:
    severity: critical
  annotations:
    summary: "Prometheus target {{ $labels.instance }} down"

Commentaires

camille35

Membre depuis le 18/04/2019

salut pour les redémarrages t'utilises la clause for: 5m par exemple. l'alerte ne se déclenchera qu'après 5 minutes de up == 0. ça filtre pas mal le bruit

alice-pages

Membre depuis le 24/04/2019

et pense à ajouter un group_left avec up et d'autres métriques pour avoir plus de contexte quand ça tombe. ça aide à trier les vrais problèmes des faux positifs

mlegros

Membre depuis le 20/05/2020

ok je vais tester le for: 5m et je vais voir pour le group_left après. j'espère que ça va calmer un peu les notifs. thx !

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire