Alertmanager ne reçoit plus d'alertes Prometheus

agathe69 02/05/2024
RÉSOLU
agathe69
Auteur
Avatar de agathe69
agathe69
Auteur

bonjour les devs j'ai un souci depuis ce matin prometheus génère bien des alertes on les voit dans l'ui mais alertmanager lui ne déclenche rien. aucune notif aucune alerte en cours dans l'ui d'alertmanager. la config a pas bougé. qqn a déjà vu ça ?


# prometheus.yml relevant part
alerting:
  alertmanagers:
  - static_configs:
    - targets: ['alertmanager.devops-feed.svc.cluster.local:9093']
02/05/2024 à 15:34

8 commentaires

henri-aubert
Membre Actif Secouriste
Avatar de henri-aubert
henri-aubert
Membre Actif Secouriste

hello t'as checké les logs de prometheus et d'alertmanager ? des fois prom a du mal à joindre alertmanager genre erreur réseau ou tls. et alertmanager si il crash à la réception ça se verrait dans ses logs

03/05/2024 à 13:31
agathe69
Auteur
Avatar de agathe69
agathe69
Auteur

ouais les logs prom montrent pas d'erreur vers alertmanager. alertmanager est up et tourne sur le bon port. je peux curl son endpoint /metrics depuis prom sans souci

04/05/2024 à 11:54
henri-aubert
Membre Actif Secouriste
Avatar de henri-aubert
henri-aubert
Membre Actif Secouriste

si c'est pas le réseau est-ce que tu as des silences configurés dans alertmanager ? des fois un silence un peu trop large couvre sans faire exprès tes nouvelles alertes. ou des routes qui ne matchent plus tes labels d'alerte

05/05/2024 à 10:12
agathe69
Auteur
Avatar de agathe69
agathe69
Auteur

non pas de silences bizarres. j'ai un doute sur le temps par contre. les clocks des serveurs sont bien synchronisées ? prom envoie des timestamps et si alertmanager est trop décalé il pourrait ignorer les alertes

06/05/2024 à 08:44
henri-aubert
Membre Actif Secouriste
Avatar de henri-aubert
henri-aubert
Membre Actif Secouriste

très bonne piste ! décalage horaire ça peut être un enfer. vérifie avec ntp ou chrony sur tes instances prom et alertmanager. même quelques secondes de décalage peuvent foutre le bordel sur les alertes et les silences

07/05/2024 à 04:27
agathe69
Auteur
Avatar de agathe69
agathe69
Auteur

bon je viens de vérifier les clocks elles sont ok. par contre j'ai restart alertmanager avec un niveau de log plus verbose et je vois des erreurs de parsing dans la config. mon receiver slack avait un champ en trop. my bad

07/05/2024 à 22:50
henri-aubert
Membre Actif Secouriste
Avatar de henri-aubert
henri-aubert
Membre Actif Secouriste

ah la config YAML classique ! content que t'aies trouvé. un simple espace en trop ou un champ mal indenté et c'est le drame. thx pour le feedback

08/05/2024 à 18:28
agathe69
Auteur
Avatar de agathe69
agathe69
Auteur

ouais c'était ça. merci encore pour l'aide. la prochaine fois je regarderai la config alertmanager d'abord ^^

09/05/2024 à 17:17

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire