Membre depuis le 06/09/2024
yo la team. on a des alertes Prometheus qui flappent non-stop sur les pods de nos microservices. genre cpuusagehigh ou MemoryUsageHigh. ça s'active 30s puis ça se désactive direct. c'est super chiant on sait plus quoi regarder
Vous devez être connecté pour poster un message !
Recevoir les derniers articles gratuitement en créant un compte !
S'inscrire
Commentaires
roland33
Membre depuis le 21/07/2024
salut. c'est un souci de
thresholdtrop bas ou dedurationtrop courte ? si tes pods ont des pics d'utilisation courts c'est normal que ça flappe. essaie d'augmenter ladurationde ton alerte à genre 5min et de mettre unthresholdun peu plus haut. et regarde la métriquerate(container_cpu_usage_seconds_total[5m])au lieu duinstantroy-eric
Membre depuis le 06/09/2024
d'acc je vais essayer d'augmenter la durée et le seuil. on utilisait la métrique brute
container_cpu_usage_seconds_totaldu coup c'est ptete ça. je vais passer sur laratesur 5min pour lisser. merci du tiproland33
Membre depuis le 21/07/2024
de rien. si ça continue de flapper après ça c'est ptete un problème de
resiliencede tes services plutôt que de monitoring. mais commence par affiner tes alertesroy-eric
Membre depuis le 06/09/2024
ok super je vous tiens au jus. thx