Membre depuis le 16/07/2019
t'as bien testé la connectivité de alertmanager vers ton smarthost smtp et vers l'url slack ? un bête
curl -v https://hooks.slack.com/... depuis le pod alertmanager
Membre depuis le 03/01/2020
vérifie aussi les filtres ou silences actifs dans l'UI d'alertmanager. parfois on oublie un silence qui bloque tout sans s'en rendre compte
Membre depuis le 07/03/2020
et les logs du smarthost SMTP ? il voit les tentatives de connexion de alertmanager ? c'est souvent un problème de TLS ou d'auth avec le smtp
Membre depuis le 06/05/2024
les creds pour slack et smtp sont bien dans des secrets kubernetes ou des variables d'environnement ? pas de typo ? et les permissions du service account pour accéder aux secrets
Membre depuis le 17/04/2020
ok pour le curl slack ça marche. le smarthost j'ai accès aux logs j'ai rien vu passer du tout. par contre les silences j'en ai bien un mais il est périmé. ptete un souci d'heure ?
Membre depuis le 16/07/2019
si t'as rien dans les logs smtp c que alertmanager essaie même pas d'envoyer. le problème est en amont. t'as quelle version d'alertmanager ?
Membre depuis le 03/01/2020
regarde la métrique
alertmanager_notifications_failed_total dans prometheus ça peut te donner une idée si il y a des tentatives et des échecs silencieux
Membre depuis le 07/03/2020
et si tu crées une règle temporaire super simple sans group_by juste un receiver et tu déclenches une alerte juste pour voir si un mail part ? pour isoler le problème
Membre depuis le 17/04/2020
alors
alertmanager_notifications_failed_total est à zéro. c'est bizarre. j'ai essayé la règle simple et toujours rien. j'ai pas précisé c'est un déploiement k8s avec le prometheus operator
Membre depuis le 06/05/2024
ah le prometheus operator ! t'as bien configuré le
alertmanager_config_secret et que le fichier dedans est au bon format ? des fois l'operator met sa propre config par défaut si le secret est pas parfait. check les logs du prometheus operator aussi
Membre depuis le 16/07/2019
le prometheus operator est super sensible à l'indentation et aux champs manquants dans le secret de config. un petit linter yaml sur ton fichier peut te sauver
Membre depuis le 17/04/2020
vous êtes des génies ! l'operator reécrivait ma config parce que mon secret contenait une erreur d'indentation toute conne. dès que j'ai fixé le yaml dans le secret ça a pété les notifs. big up !
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
claire49
Membre depuis le 17/04/2020
salut la commu j'ai un souci avec mon alertmanager. les alertes sont bien générées par prometheus je les vois dans l'UI alertmanager mais aucune notification est envoyée ni par email ni par slack. le log d'alertmanager est silencieux pas d'erreur particulière juste que ça fait rien