prometheus alertmanager ne notifie personne

claire49 18/05/2024
RÉSOLU
claire49
Auteur Actif
Avatar de claire49
claire49
Auteur Actif

salut la commu j'ai un souci avec mon alertmanager. les alertes sont bien générées par prometheus je les vois dans l'UI alertmanager mais aucune notification est envoyée ni par email ni par slack. le log d'alertmanager est silencieux pas d'erreur particulière juste que ça fait rien

# partie de mon alertmanager.yml
route:
  receiver: 'default-receiver'
  group_by: ['alertname']
  group_wait: 30s
  group_interval: 5m
  repeat_interval: 4h

receivers:
  - name: 'default-receiver'
    email_configs:
      - to: 'admin@example.com'
        from: 'alertmanager@example.com'
        smarthost: 'smtp.example.com:587'
        auth_username: 'user'
        auth_password: 'password'
        require_tls: true
    slack_configs:
      - channel: '#alerts'
        api_url: 'https://hooks.slack.com/services/t00000000/b00000000/xxxxxxxxxxxxxxxxxxxxxxxx'
18/05/2024 à 22:35

12 commentaires

gallet-laurence
Membre Actif
Avatar de gallet-laurence
gallet-laurence
Membre Actif

t'as bien testé la connectivité de alertmanager vers ton smarthost smtp et vers l'url slack ? un bête

curl -v https://hooks.slack.com/...
depuis le pod alertmanager

19/05/2024 à 20:27
lenoir-guillaume
Membre Actif
Avatar de lenoir-guillaume
lenoir-guillaume
Membre Actif

vérifie aussi les filtres ou silences actifs dans l'UI d'alertmanager. parfois on oublie un silence qui bloque tout sans s'en rendre compte

20/05/2024 à 16:25
labbe-alain
Membre Actif Secouriste
Avatar de labbe-alain
labbe-alain
Membre Actif Secouriste

et les logs du smarthost SMTP ? il voit les tentatives de connexion de alertmanager ? c'est souvent un problème de TLS ou d'auth avec le smtp

21/05/2024 à 15:17
benard-aurore
Membre Actif
Avatar de benard-aurore
benard-aurore
Membre Actif

les creds pour slack et smtp sont bien dans des secrets kubernetes ou des variables d'environnement ? pas de typo ? et les permissions du service account pour accéder aux secrets

22/05/2024 à 15:16
claire49
Auteur Actif
Avatar de claire49
claire49
Auteur Actif

ok pour le curl slack ça marche. le smarthost j'ai accès aux logs j'ai rien vu passer du tout. par contre les silences j'en ai bien un mais il est périmé. ptete un souci d'heure ?

23/05/2024 à 12:52
gallet-laurence
Membre Actif
Avatar de gallet-laurence
gallet-laurence
Membre Actif

si t'as rien dans les logs smtp c que alertmanager essaie même pas d'envoyer. le problème est en amont. t'as quelle version d'alertmanager ?

24/05/2024 à 12:38
lenoir-guillaume
Membre Actif
Avatar de lenoir-guillaume
lenoir-guillaume
Membre Actif

regarde la métrique

alertmanager_notifications_failed_total
dans prometheus ça peut te donner une idée si il y a des tentatives et des échecs silencieux

25/05/2024 à 07:12
labbe-alain
Membre Actif Secouriste
Avatar de labbe-alain
labbe-alain
Membre Actif Secouriste

et si tu crées une règle temporaire super simple sans group_by juste un receiver et tu déclenches une alerte juste pour voir si un mail part ? pour isoler le problème

26/05/2024 à 03:55
claire49
Auteur Actif
Avatar de claire49
claire49
Auteur Actif

alors

alertmanager_notifications_failed_total
est à zéro. c'est bizarre. j'ai essayé la règle simple et toujours rien. j'ai pas précisé c'est un déploiement k8s avec le prometheus operator

26/05/2024 à 22:43
benard-aurore
Membre Actif
Avatar de benard-aurore
benard-aurore
Membre Actif

ah le prometheus operator ! t'as bien configuré le

alertmanager_config_secret
et que le fichier dedans est au bon format ? des fois l'operator met sa propre config par défaut si le secret est pas parfait. check les logs du prometheus operator aussi

27/05/2024 à 18:48
gallet-laurence
Membre Actif
Avatar de gallet-laurence
gallet-laurence
Membre Actif

le prometheus operator est super sensible à l'indentation et aux champs manquants dans le secret de config. un petit linter yaml sur ton fichier peut te sauver

28/05/2024 à 15:35
claire49
Auteur Actif
Avatar de claire49
claire49
Auteur Actif

vous êtes des génies ! l'operator reécrivait ma config parce que mon secret contenait une erreur d'indentation toute conne. dès que j'ai fixé le yaml dans le secret ça a pété les notifs. big up !

29/05/2024 à 10:06

Laisser une réponse

Vous devez être connecté pour poster un message !

Rejoindre la communauté

Recevoir les derniers articles gratuitement en créant un compte !

S'inscrire